Skip To Content

Créer un modèle de régression

L’outil Créer un modèle de régression permet de modéliser la relation entre deux variables explicatives ou plus et une variable de réponse en adaptant une équation linéaire aux données observées. Chaque valeur de la variable indépendante (x) est associée à une valeur de la variable dépendante (y).

L’outil Créer un modèle de régression utilise le type de régression Moindres carrés ordinaires.

Exemple

Une organisation environnementale étude la cause des émissions de gaz à effet de serre par pays de 1990 à 2015. L’outil Créer un modèle de régression permet de créer une équation capable d’estimer la quantité d’émissions de gaz à effet de serre par pays en fonction de variables explicatives, telles que la population et le produit intérieur brut (PIB).

Remarques sur l'utilisation

L'outil Créer un modèle de régression est accessible à l’aide du bouton ActionAction sous How is it related? (Quel est le type de relation ?) sous l’onglet Find Answers (Trouver des réponses).

Vous pouvez choisir un champ numérique ou de taux/ratio comme variable dépendante. La variable dépendante est le champ numérique que vous tentez d’expliquer avec votre modèle de régression. Par exemple, si vous créez un modèle de régression pour déterminer les causes de mortalité infantile, le taux de mortalité infantile est la variable dépendante.

Vous pouvez choisir jusqu’à 20 champs numériques ou de taux/ratio comme variables explicatives. Les variables explicatives sont des variables indépendantes qui peuvent être sélectionnées dans le cadre du modèle de régression pour expliquer la variable dépendante. Par exemple, si vous créez un modèle de régression visant à déterminer les causes de mortalité infantile, les variables explicatives peuvent alors inclure les taux de pauvreté, les taux de maladie et les taux de vaccination. Si vous avez choisi quatre variables explicatives ou moins, vous pouvez créer un nuage de points ou une matrice de nuages de points en cliquant sur Visualize (Visualiser).

Les valeurs en sortie suivantes sont données sous Model Statistics (Statistiques du modèle) :

  • Équation de régression
  • R2
  • R2 ajusté
  • Test de Durbin-Watson

L’équation de régression et les statistiques peuvent servir à analyser la précision du modèle.

Une fois l’outil exécuté, un nouveau jeu de données de fonctions est ajouté à la fenêtre de données. Le jeu de données de fonctions peut ensuite être utilisé dans l’outil Prédire une variable. L’outil crée également un nouveau jeu de données de résultat, qui inclut tous les champs de l’entrée, plus les champs estimated, residual et standardized_residual. Les champs comportent les informations suivantes :

  • estimated : valeur de la variable dépendante estimée par le modèle de régression.
  • residual : différence entre la valeur de champ d’origine et la valeur estimée de la variable dépendante.
  • standardized_residual : ratio du résiduel et de l’écart type du résiduel.

Fonctionnement de l’outil Créer un modèle de régression

Hypothèses

Un modèle Moindres carrés ordinaires peut être créé si les hypothèses suivantes se vérifient :

  • Le modèle doit être linéaire dans les paramètres.
  • Les données sont un échantillonnage aléatoire de la population.
  • Les variables indépendantes ne sont pas trop fortement colinéaires.
  • Les variables indépendantes sont mesurées avec précision de sorte que l’erreur de mesure est négligeable.
  • Les résiduels attendus sont toujours égaux à zéro.
  • Les résiduels ont une variance constante (variance homogène).
  • Les résiduels sont distribués normalement.