120199: Impossible d’estimer le modèle en raison de la multicolinéarité (redondance de données).

Description

Le modèle de régression ne peut pas se résoudre (la matrice du modèle ne peut pas être inversée) en présence de multicolinéarité. La multicolinéarité se produit lorsque deux variables ou plus sont redondantes. Chaque variable doit être indépendante des autres variables. Un modèle efficace contient des variables explicatives qui obtiennent chacune une facette différente de la variable dépendante que vous tentez de prévoir ou de comprendre.

Solution

  1. Supprimez tout champ redondant depuis l’ensemble des variables explicatives.
  2. Identifiez et supprimez toute variable explicative qui a la même valeur pour toutes les entités (par exemple, un champ contenant que des zéros).
  3. Créez une matrice de nuages de points pour vos variables explicatives (ou un échantillon d’entre elles) et déterminez s’il s’agit de corrélations presque parfaites. Si tel est le cas, pensez à supprimer une des variables correspondantes de votre modèle.