Description
Lorsqu’il existe plus d’un million de valeurs uniques dans une zone, les valeurs statistiques Majority (Majorité), Median (Médiane), Minority (Minorité), Percentile (Centile) et Variety (Variété) peuvent être approximatives.
Les statistiques sont calculées à l'aide de l'algorithme Greenwald Khanna (Greenwald, M., & Khanna, S., 2001). Pour Median (Médiane) et Percentile (Centile), la valeur de centile réelle du résultat est à plus ou moins 0,0001 % de la valeur de centile demandée. Par exemple, avec Median (Médiane), la valeur de centile réelle du résultat est comprise entre le centile 49,9999 et le centile 50,0001. Les statistiques Majority (Majorité), Minority (Minorité) et Variety (Variété) sont également estimées à partir de la structure de données Greenwall-Khanna, mais leurs limites sur leurs erreurs ne sont pas bien définies.
Référence : Greenwald, M., & Khanna, S. (2001). "Space-efficient online computation of quantile summaries" ACM SIGMOD Record, 30(2), 58-66.
Solution
Ce message est fourni à titre d’information. Aucune autre action n’est requise.
Vous avez un commentaire à formuler concernant cette rubrique ?