Skip To Content

Jeux de données de fonctions

Les jeux de données de fonctions sont créés en tant que sortie de l’outil Créer un modèle de régression. Un jeu de données de fonctions contient l’équation et les statistiques d’un modèle de régression et ne permet pas de créer une carte, un diagramme ou une table.

Les jeux de données de fonctions sont utilisés en entrée dans l’outil Prédire une variable comme modèle de régression. Vous pouvez ouvrir l’outil Prédire une variable en faisant glisser un jeu de données de fonctions sur une fiche.

Statistiques

Les jeux de données de fonctions stockent l’équation et les statistiques d’un modèle de régression, notamment la valeur R2, la valeur R2 ajustée et le test de Durbin-Watson. Ces statistiques sont visibles dans la fenêtre de données en développant le jeu de données de fonctions.

L’équation de régression se présente sous le format suivant :

y=b0+b1x1+b2x2+...+bnxn

où y est la variable dépendante, bn représente les paramètres calculés et xn représente les variables explicatives.

La valeur R2, également connue sous le nom de coefficient de détermination, est un nombre compris entre 0 et 1 qui mesure l’aptitude de la ligne de compromis à modéliser les points de données (les valeurs les plus proches de 1 indiquent une plus grande précision des modèles).

La valeur R2 ajustée est également une mesure comprise entre 0 et 1, mais elle tient compte d’indicateurs supplémentaires qui peuvent entraîner une meilleure adéquation d’un modèle en fonction du hasard seul. Il est par conséquent préférable d’utiliser la valeur R2 ajustée lorsque le modèle comporte un grand nombre d’indicateurs ou lorsque vous comparez des modèles avec différents nombres d’indicateurs.

Le test de Durbin-Watson mesure l’auto-corrélation des résiduels à partir d’une analyse de régression sur une échelle allant de 0 à 4. Sur cette échelle, la plage 0 à 2 indique une auto-corrélation positive, 2 indique l’absence d’auto-corrélation et la plage 2 à 4 indique une auto-corrélation négative. Une auto-corrélation basse est préférable dans un modèle de régression, ce qui signifie que les valeurs du test de Durbin-Watson plus proches de 2 sont plus favorables.

Remarque :

Le calcul du test de Durbin-Watson dépend de l’ordre de vos données. Il est important que vos données soient classées de manière séquentielle, en particulier si elles sont liées au temps. Si vos données ne sont pas classées correctement, la valeur du test de Durbin-Watson risque de ne pas être précise.


Dans cette rubrique
  1. Statistiques