함수 데이터셋

Insights in ArcGIS Online
Insights in ArcGIS Enterprise
Insights Desktop

함수 데이터셋은 회귀 모델 생성의 결과로 생성됩니다. 함수 데이터셋에는 회귀 모델의 방정식과 통계가 포함되어 있습니다.

함수 데이터셋 사용

함수 데이터셋은 변수 예측의 입력 회귀 모델로 사용됩니다. 함수 데이터셋을 맵 카드로 드래그하여 변수 예측을 열 수 있습니다.

포인트 차트는 절편 및 각 설명 변수에 대한 계수 및 신뢰 구간을 보여주며, 데이터 창에서 함수 데이터셋을 확장하고 신뢰 구간 보기를 클릭하여 생성할 수 있습니다.

팁:

Drag-N Drop 함수 데이터셋을 다른 회귀 모델에서 생성된 포인트 차트로 드래그하여 모델 간의 설명 변수에 대한 신뢰 구간을 비교합니다.

통계(Statistics)

함수 데이터셋은 회귀 모델의 방정식과 통계를 저장합니다. 데이터 창에서 함수 데이터셋을 확장하거나 데이터 테이블을 열어서 통계를 볼 수 있습니다.

다음 통계는 데이터 창에서 제공됩니다.

통계설명

회귀 방정식

회귀 방정식은 다음과 같은 형식으로 구성됩니다.

y=b0+b1x1+b2x2+...+bnxn

여기서 y는 종속 변수이며 bn는 계산된 매개변수를 나타내고 xn는 설명 변수를 나타냅니다.

R2

결정계수라고도 하는 R2 값은 0과 1 사이의 숫자로서, 최적선이 데이터 포인트를 얼마나 정확하게 모델링하는지를 측정합니다. 1에 가까운 값일수록 더 정확하게 모델링됩니다.

조정된 R2

조정된 R2 역시 0과 1 사이의 값이지만 이 결정계수의 경우 변동만 기반으로 모델의 적합성을 높일 수 있는 추가 예측 변수가 고려됩니다. 따라서 모델에 예측 변수가 많이 있거나 다양한 개수의 예측 변수가 포함된 모델을 비교하는 경우에는 조정된 R2 값을 사용하는 것이 좋습니다.

Durbin-Watson

Durbin-Watson 검정은 회귀 분석으로 계산된 잔차의 자기상관관계를 0~4의 척도로 측정합니다. 척도가 0~2인 경우 양의 자기상관관계이고, 2이면 자기상관관계가 없으며, 2~4인 경우에는 음의 자기상관관계입니다. 회귀 모델에는 낮은 자기상관관계를 갖는 것이 좋습니다. 즉 2에 가까운 Durbin-Watson 검정 값일수록 더 좋습니다.

비고:

Durbin-Watson 검정 계산은 데이터의 순서에 따라 달라집니다. 특히 시간과 관련된 데이터의 경우 순차적으로 정렬하는 것이 중요합니다. 데이터의 순서가 올바르지 않으면 Durbin-Watson 검정 값이 정확하지 않을 수 있습니다.

잔차 표준 오차

잔차 표준 오차는 회귀 모델이 새 데이터로 값을 예측할 수 있는 정확도를 측정합니다. 값이 작을수록 더 정확한 모델을 나타냅니다. 또한 잔차 자유도의 값이 잔차 표준 오차와 함께 제공됩니다.

F 통계

F 통계는 계수가 0과 상당히 다른지 여부를 파악하여 회귀 모델의 예측 기능을 결정하는 데 사용됩니다. F 통계는 0 이상의 값으로 제공되며 자유도에 대한 2개의 값을 포함합니다. 첫 번째는 설명 변수의 자유도이고 두 번째는 잔차에 대한 자유도입니다.

p-값

F 통계의 P-Value는 회귀 모델에 대한 글로벌 유의성 검정입니다. P-Value는 0.0과 1.0 사이의 값으로 제공됩니다. 0과 0.05 사이의 값은 글로벌 모델이 통계적으로 유의함을 나타냅니다.

다음 통계는 데이터 테이블에서 제공됩니다.

통계설명

변수

설명 변수의 절편과 이름입니다.

계수

회귀 방정식의 B-Value로, 각 설명 변수의 y 절편 및 기울기에 해당합니다.

표준 오차

표준 오차는 모델에 사용된 각 예측 변수의 편자를 측정합니다. 값이 작을수록 더 정확한 예측 변수를 나타냅니다.

T-Value

T-Value는 계수가 0과 크게 다른지 여부를 파악하여 회귀 계수의 예측 기능을 결정하는 데 사용됩니다.

p-값

P-Value는 T-Value와 관련이 있으며 회귀 모델의 계수에 대한 로컬 유의성을 테스트합니다. P-Value는 0.0과 1.0 사이의 값으로 제공됩니다. 0.0과 0.05 사이의 값은 계수가 통계적으로 유의함을 나타냅니다.

신뢰도 간격

신뢰 구간은 상한과 하한을 지정하여 계수가 범위 내에 속하는 특정 수준의 확실성을 가질 수 있습니다. 예를 들어 95% 미만 신뢰 구간이 10이고 95% 초과 신뢰 구간이 15인 경우 계수의 실제 값이 10에서 15 사이라는 95% 신뢰도를 가질 수 있습니다.

다음 신뢰 구간은 데이터 테이블에서 제공됩니다.

  • 90% 미만
  • 90% 초과
  • 95% 미만
  • 95% 초과
  • 99% 미만
  • 99% 초과

표준화된 계수

표준화된 계수는 종속 변수 및 설명 변수의 분산이 1이 되도록 데이터를 표준화하여 계산됩니다. 표준화된 계수는 계수 값을 다른 측정 단위와 비교하는 데 특히 유용합니다.

표준화된 신뢰 구간

표준화된 신뢰 구간은 상한과 하한을 지정하여 표준화된 계수가 범위 내에 속하는 특정 수준의 확실성을 가질 수 있습니다.

다음의 표준화된 신뢰 구간은 데이터 테이블에서 제공됩니다.

  • 90% 미만
  • 90% 초과
  • 95% 미만
  • 95% 초과
  • 99% 미만
  • 99% 초과

함수 데이터셋에서 통계 결과를 사용하고 해석하는 방법에 대한 자세한 내용은 회귀 분석을 참고하세요.