色またはサイズを使用してスタイルを適用して数値データを表示する場合、そのデータを分類して (つまり、データをクラスまたはグループに分けて) クラスの範囲と閾値を定義できます。 たとえば、年齢別人口データを最大 10 のグループに分け (0 ~ 9 歳、10 ~ 19 歳、20 ~ 29 歳など)、これらのクラスをマップ上で視覚的に特定できます。
データの量に応じて、最大で 10 のクラスを作成できます。 データが多いほど、多くのクラスを追加できます。 クラスの範囲とクラスの閾値 (各クラスを区切る上限と下限) を定義する方法によって、各フィーチャがどのクラスに分類されるかが決定し、そのレイヤーの表現が決まります。 各種の分類方法によりクラスを変えることで、マップの外観を変更できます。 一般的には、似たような値を持つフィーチャが同じクラスに分類されるようにすることが良いとされます。
自然分類
自然分類方法 (別名 Jenks の最適化) は、データの自然なグループ化に基づいています。 クラス閾値は、類似する値を最適にグループ化したうえで、国有林の木の高さなど、クラス間の差異を最大化するように設定されます。 フィーチャは、データ値の差異が比較的大きい部分に境界が設定されるようにクラスに分割されます。
自然分類は、クラスター化された値を 1 つのクラス内に配置するため、値が均等に分散していないデータをマッピングする際に適した分類手法です。
等間隔
等間隔分類方法では、属性値の範囲を同じサイズの下位範囲に分割します。 この分類方法では、間隔の数 (または下位範囲) を指定すると、データは自動的に分割されます。 たとえば、値の範囲が 0 ~ 300 である属性フィールドに対して 3 つのクラスを指定すると、0 ~ 100、101 ~ 200、201 ~ 300 という範囲の 3 つのクラスが作成されます。
等間隔分類は、パーセンテージや温度など、一般的なデータの範囲に最適です。 この方法では、特定の属性値について、他の属性値と比較したときの総数を強調することができます。 たとえば、ある店舗が、合計売上の上位 1/3 を構成する店舗のグループに属していることを示すような場合です。
標準偏差
標準偏差分類では、フィーチャの属性値が平均値からどれだけ離れているかを示します。 標準偏差分類は、平均値を上回る値と下回る値を強調することで、平均値より上または下のフィーチャを示すのに役立ちます。 この分類は、ある地域の人口密度を表示したり、国全体で差し押さえ比率を比較する場合など、平均値との関連を知ることが重要な場合に使用します。 マップを詳細に調べる場合は、標準偏差のクラス サイズを 1 から .5 に変更できます。
等量分類
等量分類方法では、各クラスには同数のフィーチャが含まれます (1 クラスに 10 や 1 クラスに 20 など)。 空のクラスや、値の数が多すぎたり少なすぎたりするクラスはありません。 等量分類は、線形 (均等) に分散しているデータに適しています。 各クラスに含まれるフィーチャまたは値の数が同じである必要がある場合、等量分類を使用します。
各クラスのフィーチャが同じ数でグループ化されるため、作成されたマップの意図が正しく伝わらない場合がよくあります。 似たようなフィーチャが異なるクラスに分類されたり、大きく異なる値を持つフィーチャが同じクラスに分類されたりすることがあります。 この歪みは、クラスの数を増やすことにより最小限に抑えることができます。
手動間隔
カスタム クラスを定義する場合は、クラスの閾値を手動で追加し、データに適したクラス範囲を設定することができます。 また、いずれかの標準分類手法を基点として、必要に応じて調整することもできます。 データのマッピングに関して、何らかの基準やガイドラインがすでに存在していることがあります。たとえば、ある機関で、すべてのマップに標準のクラスまたは閾値 (竜巻の強度を分類するための藤田スケール (F スケール) など) が使用される場合などです。
参考資料
主題図の各分類方法の違いは、「より良い分類が主題図の目的を定義する」の記事で説明しています。