비고:
데이터 엔지니어링은 Insights desktop에서 사용할 수 있습니다. 모든 Insights in ArcGIS Online 및 Insights in ArcGIS Enterprise 사용자는 Insights desktop에 대한 접근 권한이 있습니다. 자세한 내용은 ArcGIS Insights 소개를 참고하세요.
데이터 엔지니어링은 현재 미리 보기 상태입니다.
열 도구는 특정 열의 데이터를 변경하는 데 사용되며, 데이터 모델 아래 테이블의 개별 열에서 접근합니다. 열 도구가 적용된 후 데이터 모델에 추가됩니다.
데이터 유형 변환
데이터 유형은 Insights의 모든 열에 적용됩니다. 입력 데이터의 형식에 따라 기본 데이터 유형이 모든 열에 대해 정확하지 않을 수 있습니다. 예를 들어 .csv 파일은 날짜/시간 형식을 지원하지 않으므로 모든 날짜/시간 열을 문자열로 가져옵니다.
열은 데이터 유형 변환 도구를 사용하여 문자열, 정수, 실수 또는 날짜/시간 데이터 유형으로 변환할 수 있습니다.
데이터 유형을 변환하려면 다음 단계를 완료합니다.
- 필요한 경우 Insights desktop에서 데이터 워크북을 열고 데이터를 추가합니다.
- 열 이름 옆에 있는 화살표를 클릭하여 열 도구 메뉴를 확장합니다.
비고:
뷰가 모델 또는 맵 전용인 경우 테이블 표시 버튼 을 클릭합니다.
- 데이터 유형 변환을 선택합니다.
- 결과 데이터 유형에서 열을 변환할 데이터 유형을 선택하고 필요한 형식 옵션을 적용합니다.
- 열을 날짜/시간으로 변환하려면 날짜/시간 형식을 입력합니다.
- 정수 또는 실수로 변환하려면 데이터에 사용되는 소수점 구분 기호 유형(마침표 또는 쉼표)을 선택합니다.
- 적용을 클릭합니다.
열이 선택한 데이터 유형으로 변환됩니다.
정수
정수 데이터 유형은 소수 값이 없는 숫자입니다.
숫자가 있는 모든 열은 정수로 변환될 수 있습니다. 열에 숫자가 아닌 문자가 포함되어 있으면 해당 문자가 제거됩니다.
열에 소수 값이 포함되어 있으면 소수점 뒤의 숫자가 제거되고 정수는 반올림되지 않습니다. 열을 실수로 변환하고 ROUND() 함수를 사용해 새 열을 계산하여 숫자를 반올림할 수 있습니다.
정수 데이터 형식은 Insights 워크북에서 숫자 필드로 읽습니다.
Double
실수(또는 2배 정밀도 부동 소수점) 데이터 유형은 소수 값을 허용하는 숫자입니다.
숫자가 있는 모든 열은 실수로 변환될 수 있습니다. 열에 숫자가 아닌 문자가 포함되어 있으면 해당 문자가 제거됩니다.
실수 데이터 형식은 Insights 워크북에서 숫자 필드로 읽습니다.
날짜/시간
날짜/시간 열은 날짜만, 시간만 또는 날짜와 시간이 될 수 있습니다.
열을 날짜/시간 데이터 형식으로 변환하려면 날짜/시간 형식이 필요합니다. 기본 날짜/시간 형식은 ISO 8601입니다. 데이터가 ISO 8601 형식을 사용하지 않는 경우 데이터와 일치하도록 사용자 설정 형식 상자의 형식을 변경해야 합니다.
비고:
단일 열의 모든 날짜 및 시간은 동일한 형식을 사용해야 합니다. 올바른 시간이 사용되도록 12시간 표기법을 사용하는 모든 시간 값에 대한 기간 컴포넌트를 포함하는 것이 가장 좋습니다.
날짜/시간 형식에 지원되는 변수는 다음과 같습니다.
날짜/시간 컴포넌트 | 변수 | 지원되는 값 |
---|---|---|
월 | MM | 01~12 |
M | 1~12 | |
일 | DD | 01~31 |
D | 1~31 | |
년 | YYYY | 4자리 연도 |
YY | 2자리 연도(00~99) | |
시간 | HH | 00~24 |
H | 0~24 | |
hh | 01~12 | |
시간 | 1~12 | |
분 | mm | 00~59 |
m | 0~59 | |
초 | ss | 00~59 |
s | 0~59 | |
기간 | A | AM, PM 또는 지역에 따라 지원되는 기간 형식입니다. |
a | ||
시간대 | ZZ | +HHmm 또는 -HHmm |
TZD | +hh:mm 또는 -hh:mm |
필터 값
속성 필터는 쿼리를 사용하여 데이터셋에서 불필요한 데이터를 제거합니다. 값 필터링 도구를 사용하여 데이터셋의 크기를 줄이고 분석과 관련된 데이터만 포함할 수 있습니다. 예를 들어 Null 값이 있는 항목을 제거하거나 지정된 연구 영역 또는 날짜 범위로만 데이터를 필터링할 수 있습니다.
값을 필터링하려면 다음 단계를 완료합니다.
- 필요한 경우 Insights desktop에서 데이터 워크북을 열고 데이터를 추가합니다.
- 열 이름 옆에 있는 화살표를 클릭하여 열 도구 메뉴를 확장합니다.
비고:
뷰가 모델 또는 맵 전용인 경우 테이블 표시 버튼 을 클릭합니다.
- 필터 값을 선택합니다.
- 열을 필터링하려면 다음 중 하나를 수행합니다.
- 스트링 열의 경우 표시하거나 제외할 고유 값을 선택하거나 선택 해제합니다.
- 숫자 또는 비율 열의 경우 범위의 하단 및 상단에서 슬라이더를 조정하거나 노드를 클릭하고 새 값을 입력합니다.
- 날짜/시간 열의 경우 캘린더 및 시계 버튼을 사용하여 각각 시작일과 종료일 및 시간을 조정합니다. 필터에 직접 날짜나 시간을 입력할 수도 있습니다.
각 데이터 유형에 필터 설정을 적용하는 방법에 대한 자세한 내용은 데이터 필터링을 참고하세요.
- 적용을 클릭합니다.
필터가 적용되고 필터 기준과 일치하지 않는 행이 제거됩니다.
찾기 및 바꾸기
비고:
찾기 및 바꾸기 도구는 현재 스트링 열에만 사용할 수 있습니다. 숫자 또는 날짜/시간 열의 값을 바꾸려면 열을 문자열로 변환하고 문자열을 바꾼 다음 열을 다시 기존 데이터 유형으로 변환해야 합니다.
찾기 및 바꾸기는 열에서 특정 값을 검색하고 새 값으로 바꾸는 데 사용됩니다. 이 도구는 플레이스 홀더 또는 기본값을 Null 값으로 교체하거나 철자가 틀린 문자열을 수정하거나 일관된 대소문자를 만드는 등의 용도로 사용할 수 있습니다.
값을 찾아 바꾸기를 사용하려면 다음 단계를 완료합니다.
- 필요한 경우 Insights desktop에서 데이터 워크북을 열고 데이터를 추가합니다.
- 열 이름 옆에 있는 화살표를 클릭하여 열 도구 메뉴를 확장합니다.
비고:
뷰가 모델 또는 맵 전용인 경우 테이블 표시 버튼 을 클릭합니다.
- 찾기 및 바꾸기를 선택합니다.
- 값을 찾아 바꾸려면 다음 중 하나를 수행합니다.
- 사용자 설정 문자열의 경우 문자열 탭(기본값)을 유지하고 찾기 텍스트 상자에 열에서 검색할 사용자 설정 문자열을 입력합니다. 선택적으로 대소문자를 구분해 검색하도록 하려면 대소문자 일치를 선택하고 전체 문자열 일치만 반환하려면 모든 단어 일치만을 선택합니다.
- 빈 문자열 값의 경우 빈 문자열 탭을 클릭합니다.
- Null 값의 경우 Null 탭을 클릭합니다.
- 다음 중 하나를 수행하여 바꾸기 값을 지정합니다.
- 다음으로 바꾸기 텍스트 상자에 일치하는 문자열을 바꾸는 데 사용할 문자열을 입력합니다.
- 빈 문자열로 바꾸려면 다음으로 바꾸기 텍스트 상자를 빈 상태로 둡니다.
- 빈 문자열을 Null 값으로 바꾸려면(빈 문자열 탭) Null로 바꾸기를 선택합니다.
- 선택적으로 찾기를 클릭하여 일치하는 문자열을 검색하고 강조 표시합니다.
- 바꾸기를 클릭하여 일치하는 문자열을 검색하고 바꿉니다.
- 위 단계를 반복하여 추가 문자열을 찾아 바꾸거나 완료를 클릭하여 대화 상자를 닫습니다.
일치하는 문자열이 업데이트됩니다.
열 제거
열 제거 도구를 사용하여 결과 데이터셋에서 불필요한 열을 제외합니다. 숨겨진 필드 보기를 사용하여 분석하는 동안 제거된 열을 나중에 표시할 수 없습니다. 열을 제거하면 결과 데이터셋에만 영향을 미치고 원본 데이터셋에서 열은 삭제되지 않습니다.
비고:
데이터 워크북의 데이터셋에는 열이 하나 이상 있어야 합니다. 열이 하나만 있는 데이터셋의 경우 열 제거 도구가 비활성화됩니다.
데이터셋에서 열을 제거하려면 다음 단계를 완료합니다.
- 필요한 경우 Insights desktop에서 데이터 워크북을 열고 데이터를 추가합니다.
- 열 이름 옆에 있는 화살표를 클릭하여 열 도구 메뉴를 확장합니다.
비고:
뷰가 모델 또는 맵 전용인 경우 테이블 표시 버튼 을 클릭합니다.
- 열 제거를 선택합니다.
열이 테이블에서 제거됩니다.
열 요약 표시
열 요약 표시 도구는 분포 그래프를 만들고 열의 데이터를 사용하여 통계를 계산합니다. 요약을 사용하여 철자가 잘못된 문자열이나 이상치와 같은 데이터의 문제를 찾을 수 있습니다.
비고:
열 요약 표시 도구는 값을 변경하는 대신 열에 있는 값의 시각화를 생성합니다. 데이터 모델에 열 요약 표시가 추가되지 않습니다.
열 요약을 생성하려면 다음 단계를 완료하세요.
- 필요한 경우 Insights desktop에서 데이터 워크북을 열고 데이터를 추가합니다.
- 열 이름 옆에 있는 화살표를 클릭하여 열 도구 메뉴를 확장합니다.
비고:
뷰가 모델 또는 맵 전용인 경우 테이블 표시 버튼 을 클릭합니다.
- 열 요약 표시를 클릭합니다.
열에 대한 차트와 통계가 있는 측면 패널이 나타납니다.
스트링 열
스트링 열은 막대형 차트 요약을 만듭니다. 막대형 차트에서는 열의 고유 값을 피처 개수와 함께 표시하고 요약에서는 총 피처 개수, Null 값 개수, 빈 문자열 개수 및 고유 값의 총 개수에 대한 통계를 표시합니다. 필요한 경우 차트 측면의 슬라이더를 사용하여 모든 고유 값을 확대합니다. 정렬 버튼 을 사용하여 차트를 오름차순, 내림차순 또는 알파벳순으로 정렬합니다.
막대형 차트 요약에서 선택하려면 개별 막대를 클릭합니다. 해당하는 경우 열 요약의 선택 항목이 테이블 뷰 또는 맵 뷰에 반영됩니다.
다음은 스트링 열 요약의 잠재적인 문제입니다.
- 열에 Null 값과 빈 문자열이 포함되어 있습니까? Null 값과 빈 문자열은 별도로 분석됩니다. 찾기 및 바꾸기 도구를 사용하여 Null 값을 빈 문자열로 바꾸거나 그 반대의 경우도 마찬가지입니다.
- 모든 값이 일관된 대소문자를 사용합니까? 대소문자가 일관되지 않으면 단일 고유 값으로 집계되어야 하는 값이 잘못 분리될 수 있습니다. 찾기 및 바꾸기 도구를 사용하여 문자열에 대해 대소문자를 구분하지 않고 검색을 수행하고 일치하는 모든 값을 단일 값으로 바꿉니다.
- 열에 철자가 잘못된 값이 포함되어 있습니까? 철자가 일치하지 않으면 집계가 정확하지 않습니다. 찾기 및 바꾸기 도구를 사용하여 철자가 틀린 값을 검색하고 올바른 철자로 바꿉니다.
숫자 열
숫자 열은 히스토그램 요약을 생성합니다. 히스토그램은 숫자를 그룹으로 집계하고 각 그룹 내 값의 빈도를 표시합니다. 평균 및 중앙값은 히스토그램에 표시되고 요약에는 총 피처 수, Null 값 수, 평균, 근사 중앙값, 상한 및 하한 사분위수, 표준편차, 왜곡도 및 초과 첨도에 대한 통계가 표시됩니다. x축 아래의 슬라이더를 사용하여 히스토그램의 그룹 수를 변경합니다.
히스토그램 요약에서 선택하려면 개별 막대를 클릭합니다. 해당하는 경우 히스토그램 요약의 선택 항목이 테이블 뷰 또는 맵 뷰에 반영됩니다.
다음은 숫자 열 요약의 잠재적인 문제입니다.
- 데이터셋에 예상 범위를 벗어난 이상치나 값이 포함되어 있습니까? 예를 들어 열에 백분율 값이 포함된 경우 예상 범위는 0에서 100 사이입니다. 필터 값 도구를 사용하여 잘못된 값이 있는 행을 제거합니다.
- 데이터가 정규 분포를 따릅니까? 회귀 모델 생성과 같은 일부 통계 분석에는 정규 분포 데이터가 필요합니다. 열 계산 도구를 사용하여 열에 변환을 적용합니다.
- 데이터셋에 제거해야 하는 플레이스 홀더 또는 기본값(예시: 9999)이 포함되어 있습니까? 필요한 경우 찾기 및 바꾸기 도구를 사용하여 값을 Null로 바꾸거나 값 필터링 도구를 사용하여 플레이스 홀더 또는 기본값이 포함된 행을 제거합니다.
비고:
찾기 및 바꾸기 도구는 현재 스트링 열만 지원합니다. 숫자 열을 문자열로 변환하고 문자열을 바꾼 다음 열을 다시 숫자(정수 또는 실수)로 변환해야 합니다.
날짜/시간 열
날짜/시간 열은 시계열 요약을 생성합니다. 시계열은 날짜/시간 값을 간격으로 집계하고 각 간격에 대한 개수를 표시합니다. 요약에는 총 피처 수, 최소 날짜, 최대 날짜 및 Null 값 수가 표시됩니다. 시계열 위의 슬라이더를 사용하여 그래프를 확대하고 더 세분화된 눈금으로 봅니다. 확대 수준이 필수 임계치를 통과하면 날짜/시간 간격이 적절한 간격으로 업데이트됩니다.
시계열 요약에서 선택하려면 개별 시간 포인트를 클릭합니다. 해당하는 경우 시계열 요약의 선택 항목이 테이블 뷰 또는 맵 뷰에 반영됩니다.
다음은 날짜/시간 열 요약의 잠재적인 문제입니다.
- 날짜가 필요한 날짜 범위 내에 있습니까? 필터 값 도구를 사용하여 원하는 날짜/시간 범위 내의 값만 유지합니다.
- 데이터셋에 제거해야 하는 플레이스 홀더 또는 기본값(예시: 1000-01-01)이 포함되어 있습니까? 필요한 경우 찾기 및 바꾸기 도구를 사용하여 값을 Null로 바꾸거나 값 필터링 도구를 사용하여 플레이스 홀더 또는 기본값이 포함된 행을 제거합니다.
비고:
찾기 및 바꾸기 도구는 현재 스트링 열만 지원합니다. 날짜/시간 열을 문자열로 변환하고, 문자열을 바꾸고, 열을 다시 날짜/시간으로 변환해야 합니다.