가져오기 옵션

Insights Desktop
비고:

데이터 엔지니어링은 Insights desktop에서 사용할 수 있습니다. 모든 Insights in ArcGIS OnlineInsights in ArcGIS Enterprise 사용자는 Insights desktop에 대한 접근 권한이 있습니다. 자세한 내용은 ArcGIS Insights의 오버뷰를 참고하세요.

데이터 엔지니어링은 현재 미리 보기 상태입니다.

가져오기 옵션 메뉴의 도구는 데이터 워크북에 추가될 때 데이터셋에 적용되지만 데이터 모델에는 추가되지 않습니다.

가져오기 도구

데이터 워크북으로 데이터셋을 가져올 때 다음 도구를 사용할 수 있습니다.

도구설명

데이터셋 필터

데이터셋에 고급 필터를 적용하고 샘플 데이터셋에 포함할 필드를 선택합니다.

빈 공간 자르기

문자열 값의 시작과 끝에서 공백을 제거합니다. 이 도구는 기본 설정으로 활성화되어 있습니다.

샘플링 방법

데이터셋 샘플이 생성되는 방법을 선택합니다. 이 도구는 250,000개 이상의 레코드가 있는 데이터셋에 사용할 수 있습니다.

가져오기 옵션 사용

데이터셋에 가져오기 도구를 적용하려면 다음 단계를 완료하세요.

  1. 다음 옵션 중 하나를 사용하여 페이지에 추가 창을 엽니다:
    • 데이터 워크북을 생성합니다. 데이터 워크북이 생성되었을 때 페이지에 추가 창이 나타납니다.
    • 기존 데이터 워크북의 데이터 창 위에 있는 페이지에 추가 버튼을 클릭합니다.
  2. 데이터 워크북에 추가할 데이터셋을 선택합니다.
  3. 가져오기 옵션 버튼을 클릭하여 다음 도구에 접근합니다.
    • 데이터셋 필터를 선택하여 고급 필터를 적용하고 샘플 데이터셋에 포함할 필드를 선택합니다.
    • 문자열의 시작과 끝에서 빈 공간을 다듬을지 여부를 선택합니다(기본 설정으로 활성화됨).
    • 데이터셋에 250,000개가 넘는 레코드가 있는 경우 무작위(기본값) 또는 고정 샘플링 방법을 사용할지 선택합니다.
  4. 추가를 클릭합니다.

샘플링 방법

샘플링된 데이터를 생성하는 방법에는 무작위고정의 두 가지가 있습니다.

무작위

무작위 샘플링 방법은 데이터셋에서 무작위로 250,000개의 레코드를 선택합니다. 이 방법은 고유한 값과 숫자 범위의 대표적인 샘플을 생성할 가능성이 높습니다. 그러나 상대적으로 발생이 적은 값은 샘플에서 선택되지 않을 수 있습니다. 예를 들어 한 번만 나타나는 스트링 열의 오타는 임의 샘플에서 선택되지 않을 수 있으므로 데이터 엔지니어링 워크플로의 일부로 오타를 수정해야 하는지 알 수 없습니다.

무작위 방법은 대부분의 데이터셋에서 선호되는 샘플링 방법입니다.

비고:

기본적으로 지원되지 않는 데이터베이스 커넥터는 임의 샘플링을 지원하도록 업데이트된 구성 파일이 있어야 합니다. 커넥터에 대한 최신 구성 파일을 사용하지 않는 경우 커넥터 유형을 제거한 다음 최신 파일로 커넥터를 다시 추가해야 합니다.

ArcGIS Enterprise에 대한 데이터 전용 연결은 Insights 2022.2 이상 버전이 기관에 설치되어 있지 않은 경우 무작위 샘플링을 지원하지 않습니다.

Living AtlasArcGIS public 탭의 데이터에는 무작위 샘플링이 지원되지 않을 수 있습니다.

고정

고정 방법은 데이터셋에서 발생하는 순서대로 레코드를 선택합니다. 기본 샘플 크기는 250,000개 레코드이지만 데이터셋을 가져올 때 샘플 크기를 늘리거나 줄일 수 있습니다.

샘플 크기를 늘리려는 경우 또는 발생하는 순서대로 레코드를 사용하여 대표적인 샘플을 제공할 데이터셋이 있는 경우 고정 방법을 사용합니다.

샘플에 존재하는 값에 영향을 주는 방식으로 정렬된 데이터셋에는 고정 방법을 사용하지 마세요. 예를 들어 데이터셋에는 국가 전체의 몇 년치 날씨 데이터가 있지만 처음 250,000개의 레코드에는 처음 두 달 동안의 데이터만 포함됩니다. 따라서 데이터는 전체 데이터셋에 기록된 날짜, 온도, 강수량 및 기타 기상 조건을 나타내지 않습니다.