데이터 분류는 점진 숫자 값이 여러 범위로 그룹화되고, 각 분류 범위를 색상 램프의 음영이나 색상 또는 심볼 크기로 표시하는 프로세스입니다.
사용할 분류 방법은 사용 중인 데이터와 맵으로 전달하려는 정보에 따라 달라집니다.
네츄럴 브레이크
네츄럴 브레이크 분류는 데이터에 내재된 자연스러운 그룹화를 기반으로 클래스를 생성합니다. 이 방법이 기본 분류입니다.
네츄럴 브레이크 분류는 데이터의 자연스러운 그룹화를 강조하려는 경우 사용합니다. 서로 다른 데이터로 생성된 맵을 비교하는 데 네츄럴 브레이크를 사용해서는 안 됩니다. 예를 들어 네츄럴 브레이크를 사용하면 도시 전체에서 지역의 범죄 수를 비교할 수 있습니다. 총 범죄 수가 비슷한 네이버후드는 동일한 심볼 크기로 심볼화되도록 총 범죄 수가 그룹화됩니다.
등간격
등간격 분류는 속성 값 범위를 같은 크기의 하위 범위로 나눕니다.
등간격 분류는 다른 값을 기준으로 속성의 양을 강조합니다. 등간격은 익숙한 범위가 있는 데이터에 사용합니다. 예를 들어 등간격을 사용하면 매장 지점 간의 총 매출액을 비교할 수 있습니다. 4개 그룹을 사용할 경우 매장은 25% 범위로 나뉩니다.
등도수
등도수 분류는 속성을 동일한 수의 피처가 있는 그룹으로 나눕니다.
등도수 분류는 유사한 값을 여러 클래스에 배치하므로 맵의 모양이 왜곡될 수 있습니다. 등도수 분류는 비교적 균일한 데이터에 사용합니다. 등도수 분류를 사용하여 시각적 순위를 매길 수도 있습니다. 예를 들어 등도수 간격을 사용하면 지정된 해의 국가 간 탄소 배출량을 비교할 수 있습니다. 100개국의 배출량이 데이터셋에 포함되어 있으며 10개 그룹을 적용할 경우, 탄소 배출국 그룹 간에 구별할 수는 있지만(최고 배출 10개국, 최저 배출 10개국 등) 그룹 내에서는 구별할 수 없습니다.
표준편차
표준편차 분류는 피처의 속성이 평균값과 얼마나 다른지에 따라 피처를 분류합니다.
표준편차 분류는 정규 분포를 따르는 데이터셋에 가장 효과적이며 평균 또는 평균으로부터의 거리가 중요한 분석에 적합합니다. 예를 들어 표준편차와 확산 색상 램프를 사용하면 국가 간의 평균 기대 수명을 비교할 수 있습니다. 기대 수명이 최고인 국가와 최저인 국가는 서로 다른 어두운 음영으로 표시됩니다. 평균 기대 수명에 근접한 클래스일수록 색상이 더 밝아집니다.
팁:
표준편차 분류를 등치 맵에서 확산 색상 램프와 함께 사용해 보세요. 확산 색상 램프는 상한 및 하한은 어두운 음영으로, 평균은 무채색으로 나타냅니다.
분류되지 않음
분류되지 않은 분류는 숫자 데이터를 불연속 클래스가 아닌 연속 척도로 표시합니다.
분류되지 않음 분류는 데이터의 점진적 변화를 확인하려는 경우에 사용합니다. 예를 들어 분류되지 않음 색상 램프를 사용하면 일정하게 배치된 기상 관측소에서 주어진 시간 범위에 대해 포착한 평균 온도 측정값의 스타일을 지정할 수 있습니다. 포인트가 처리 범위 전반의 점진적인 온도 변화를 보여 줍니다.
수동
수동 분류는 데이터에 적합한 사용자 설정 클래스 구분점을 추가합니다.
수동 분류는 새 클래스 구분점을 생성하거나 다른 분류 방법을 사용하여 생성된 구분점을 수정하는 데 사용할 수 있습니다. 예를 들어 등간격을 사용하여 데이터를 분류한 다음 수동 분류를 사용하여 구분점을 어림수로 수정할 수 있습니다.
수동 분류는 동일한 그룹으로 여러 맵을 생성하려는 경우와 같이 알려진 범위를 반드시 데이터에 적용해야 하는 경우에 사용합니다. 예를 들어 수동 분류를 사용하면 도시 전체에서 시간에 따른 지역 내 빈 집 수를 비교할 수 있습니다. 동일한 그룹을 두 맵 모두에 적용하면 분류의 차이로 인한 잘못된 가정 없이 패턴과 비교가 이루어지도록 할 수 있습니다.
리소스
다음과 같은 리소스를 사용하여 자세히 알아보세요.