Notatka:
Inżynieria danych jest dostępna w aplikacji Insights desktop. Do aplikacji Insights desktop mają dostęp wszyscy użytkownicy aplikacji Insights in ArcGIS Online i Insights in ArcGIS Enterprise. Więcej informacji można znaleźć w temacie Przegląd aplikacji ArcGIS Insights.
Inżynieria danych jest obecnie dostępna w wersji przedpremierowej.
Narzędzia z menu Opcje importu są stosowane do zestawów danych, gdy są one dodawane do skoroszytu danych, ale nie są one dodawane do modelu danych.
Narzędzia importu
Podczas importowania zestawu danych do skoroszytu danych dostępne są następujące narzędzia:
Narzędzie | Opis |
---|---|
Stosowanie zaawansowanego filtru do zestawu danych i wybór pól do uwzględnienia w zestawie danych próbki. | |
Przytnij puste miejsca | Usuwanie pustych miejsc na początku i na końcu wartości znakowych. To narzędzie jest domyślnie włączone. |
Wybierz sposób tworzenia próbki zestawu danych. To narzędzie jest dostępne w przypadku zestawów danych mających ponad 250 000 rekordów. |
Użycie opcji importu
Aby zastosować do zestawu danych narzędzia importu, wykonaj następujące czynności:
- Otwórz okno Dodaj do strony przy użyciu jednej z następujących opcji:
- Utwórz skoroszyt danych. Okno Dodaj do strony jest wyświetlane podczas tworzenia skoroszytu.
- Kliknij przycisk Dodaj do strony znajdujący się powyżej panelu danych w istniejącym skoroszycie.
- Wybierz zestaw danych, który zostanie dodany do skoroszytu danych.
- Kliknij przycisk Opcje importu, aby uzyskać dostęp do następujących narzędzi:
- Wybierz narzędzie Filtruj zestaw danych, aby zastosować zaawansowany filtr i wybrać pola do uwzględnienia w zestawie danych próbki.
- Wybierz, czy należy usuwać puste miejsca z początku i końca ciągów znakowych (domyślnie włączone).
- Jeśli zestaw danych na ponad 250 000 rekordów, wybierz, czy należy używać metody próbkowania Losowe (domyślna), czy Stałe.
- Kliknij przycisk Dodaj.
Metody próbkowania
Istnieją dwie metody tworzenia próbkowanych danych: Losowe i Stałe.
Losowe
Metoda próbkowania Losowe polega na losowym wyborze do 250 000 rekordów z zestawu danych. Metoda ta powoduje zwykle utworzenie reprezentatywnej próbki unikalnych wartości i zakresów liczbowych. Jednakże wartości, które występują względnie rzadko, mogą nie zostać wybrane w próbce. Na przykład błąd w pisowni występujący w kolumnie znakowej tylko raz może nie zostać wybrany w próbce i w rezultacie nie będzie wiadomo, że konieczne jest poprawienie pisowni w ramach procedury wykonywania zadań związanej z inżynierią danych.
Metoda Losowe jest preferowaną metodą próbkowania w przypadku większości zestawów danych.
Notatka:
Pliki konfiguracyjne łączników baz danych, które nie są obsługiwane od razu, muszą zostać zaktualizowane, aby umożliwić obsługę próbkowania losowego. Jeśli w przypadku pewnego łącznika nie są używane najnowsze pliki konfiguracyjne, należy usunąć dany typ łącznika, a następnie ponownie dodać ten łącznik z najnowszymi plikami.
Połączenia tylko danych z oprogramowaniem ArcGIS Enterprise nie obsługują próbkowania losowego, jeśli w instytucji nie jest zainstalowana aplikacja Insights w wersji 2022.2 lub wyższej.
Próbkowanie losowe może nie być obsługiwane w przypadku danych pochodzących z kart Living Atlas i Dane publiczne ArcGIS.
Stałe
Metoda Stałe polega na wyborze rekordów w takiej kolejności, w jakiej występują one w zestawie danych. Domyślny rozmiar próbki to 250 000 rekordów, ale można go zwiększyć lub zmniejszyć podczas importowania zestawu danych.
Metody Stałe należy używać wtedy, gdy pożądane jest zwiększenie rozmiaru próbki lub gdy posiadany zestaw danych będzie udostępniać reprezentatywną próbkę, korzystając z rekordów w kolejności, w jakiej występują.
Nie należy używać metody Stałe w przypadku zestawów danych uporządkowanych w sposób, który wpływa na wartości istniejące w próbce. Na przykład zestaw danych może zawierać dane pogodowe dotyczące całego kraju i pochodzące z kilku lat, ale pierwsze 250 000 rekordów zawiera wyłącznie dane pochodzące z dwóch pierwszych miesięcy. Z tego względu dane temperatur, wielkości opadów atmosferycznych i innych warunków pogodowych nie będą reprezentatywne w całym zestawie danych.