Skip To Content

Créer un modèle de régression

L’outil Créer un modèle de régression permet de modéliser la relation entre deux variables explicatives ou plus et une variable de réponse en adaptant une équation linéaire aux données observées. Chaque valeur de la variable indépendante (x) est associée à une valeur de la variable dépendante (y).

L’outil Créer un modèle de régression utilise le type de régression Moindres carrés ordinaires.

Exemple

Une organisation environnementale étude la cause des émissions de gaz à effet de serre par pays de 1990 à 2015. L’outil Créer un modèle de régression permet de créer une équation pour estimer le volume des émissions de gaz à effet par pays sur la base de variables explicatives, telles que la population et le produit intérieur brut (PIB).

Remarques sur l'utilisation

L’outil Créer un modèle de régression est accessible par le bouton Action Action, situé au-dessous de la section How is it related? (Quel est le type de relation ?) sous l’onglet Find Answers (Trouver des réponses).

Vous pouvez choisir un champ numérique ou de taux/ratio comme variable dépendante. La variable dépendante est le champ numérique que vous tentez d’expliquer avec votre modèle de régression. Par exemple, si vous créez un modèle de régression pour déterminer les causes de mortalité infantile, le taux de mortalité infantile est la variable dépendante.

Vous pouvez choisir jusqu’à 20 champs numériques ou de taux/ratio comme variables explicatives. Les variables explicatives sont des variables indépendantes qui peuvent être sélectionnées dans le cadre du modèle de régression pour expliquer la variable dépendante. Par exemple, si vous créez un modèle de régression visant à déterminer les causes de mortalité infantile, les variables explicatives peuvent alors inclure les taux de pauvreté, les taux de maladie et les taux de vaccination. Si le nombre de variables explicatives choisi est inférieur ou égal à quatre, il est possible de créer un nuage de points ou une matrice de nuages de points en cliquant sur Visualize (Visualiser).

Les valeurs en sortie suivantes sont données sous Model Statistics (Statistiques du modèle) :

  • Équation de régression
  • R2
  • R2 ajusté
  • Test de Durbin-Watson

L’équation de régression et les statistiques peuvent servir à analyser la précision du modèle.

Une fois le modèle créé, un nouveau jeu de données de fonctions est ajouté à la fenêtre de données. Ce jeu de données de fonctions est alors utilisable avec l’outil Prédire une variable. L’outil Créer un modèle de régression permet également de créer un nouveau jeu de données de résultat, qui comprend tous les champs de l’entrée ainsi que les champs estimated, residual et standardized_residual. Les champs comportent les informations suivantes :

  • estimated : valeur de la variable dépendante estimée par le modèle de régression.
  • residual : différence entre la valeur de champ d’origine et la valeur estimée de la variable dépendante.
  • standardized_residual : ratio du résiduel et de l’écart type du résiduel.

Fonctionnement de l’outil Créer un modèle de régression

Hypothèses

Un modèle Moindres carrés ordinaires peut être créé si les hypothèses suivantes se vérifient :

  • Le modèle doit être linéaire dans les paramètres.
  • Les données sont un échantillonnage aléatoire de la population.
  • Les variables indépendantes ne sont pas trop fortement colinéaires.
  • Les variables indépendantes sont mesurées avec précision de sorte que l’erreur de mesure est négligeable.
  • Les résiduels attendus sont toujours égaux à zéro.
  • Les résiduels ont une variance constante (variance homogène).
  • Les résiduels sont distribués normalement.

Pour plus d’informations sur les hypothèses des modèles des moindres carrés ordinaires, reportez-vous à la rubrique Analyse de régression.