010644: 一部の統計情報は近似値です。

説明

1 つのゾーンに 100 万を超える固有値が存在する場合、最頻値、中央値、最少頻値、パーセンタイル、種類統計値は近似値になることがあります。

統計情報は、Greenwald Khanna アルゴリズム (Greenwald, M., & Khanna, S., 2001) を使用して計算されます。 中央値とパーセンタイルでは、結果の真のパーセンタイル値は要求されたパーセンタイル値の 0.0001% 以内に収まっています。 たとえば、中央値を使用すると、結果の真のパーセンタイル値は 49.9999 パーセンタイルと 50.0001 パーセンタイルの間に収まります。 最大、最小、種類の各統計情報も Greenwall-Khanna データ構造から推定されますが、その誤差の境界は明確には定義されていません。

参考文献: Greenwald, M., & Khanna, S. (2001) "Space-efficient online computation of quantile summaries" (等量分類要約の空間効率の高いオンライン計算) ACM SIGMOD Record, 30(2), 58-66.

解決策

これは情報メッセージです。 アクションは必要はありません。