Notatka:
Inżynieria danych jest dostępna w aplikacji Insights desktop. Do aplikacji Insights desktop mają dostęp wszyscy użytkownicy aplikacji Insights in ArcGIS Online i Insights in ArcGIS Enterprise. Więcej informacji na ten temat zawiera sekcja Wprowadzenie do ArcGIS Insights.
Inżynieria danych jest obecnie dostępna w wersji przedpremierowej.
Narzędzia kolumn są używane do wprowadzania zmian w danych w konkretnej kolumnie, a dostęp do nich jest uzyskiwany z poszczególnych kolumn w tabelach pod modelem. Narzędzia kolumn są dodawane do modelu danych po ich zastosowaniu.
Konwertuj typ danych
Typy danych są stosowane do każdej kolumny w aplikacji Insights. W zależności od formatowania danych wejściowych domyślny typ danych może nie być poprawny dla wszystkich kolumn. Na przykład pliki .csv nie obsługują formatowania daty/czasu, dlatego wszystkie kolumny daty/czasu są importowane jako ciągi znakowe.
Kolumny można konwertować na takie typy danych jak: ciąg znakowy, liczba całkowita, liczba podwójnej precyzji lub data/czas używając narzędzia Konwertuj typ danych.
Wykonaj następujące czynności, aby użyć skonwertować typ danych:
- Otwórz skoroszyt w aplikacji Insights desktop i w razie potrzeby dodaj dane.
- Kliknij strzałkę znajdującą się obok nazwy kolumny, aby rozwinąć menu narzędzi kolumny.
Notatka:
Jeśli widokiem jest tylko model lub mapa, kliknij przycisk Pokaż tabelę .
- Wybierz opcję Konwertuj typ danych.
- W polu Typ danych wynikowych wybierz typ danych, na który chcesz skonwertować kolumnę i zastosuj odpowiednie opcje formatowania:
- Aby skonwertować kolumnę na datę/czas, wpisz format daty/czasu.
- Aby skonwertować na liczbę całkowitą lub liczbę podwójnej precyzji, wybierz typ separatora dziesiętnego używany w danych (Kropka lub Przecinek).
- Kliknij przycisk Zastosuj.
Kolumna zostanie skonwertowana na wybrany typ danych.
Liczba całkowita
Całkowitoliczbowe typy danych to liczby bez wartości po przecinku.
Każdą kolumnę zawierającą liczby można skonwertować na typ liczb całkowitych. Jeśli kolumna zawiera znaki, które nie należą do zapisu liczbowego, są one usuwane.
Jeśli kolumna zawiera wartości dziesiętne, cyfry po przecinku są usuwane, a liczba całkowita nie jest zaokrąglana. Aby zaokrąglić liczbę, należy skonwertować kolumnę na liczby podwójnej precyzji i obliczyć nową kolumnę za pomocą funkcji ROUND().
Całkowitoliczbowe typy danych są odczytywane jako pola liczbowe w arkuszu aplikacji Insights.
Podwójnej precyzji
Typy danych podwójnej precyzji (lub zmiennoprzecinkowe o podwójnej precyzji) to liczby, które mogą zawierać wartości dziesiętne.
Każdą kolumnę zawierającą liczby można skonwertować na typ liczb podwójnej precyzji. Jeśli kolumna zawiera znaki, które nie należą do zapisu liczbowego, są one usuwane.
Typy danych podwójnej precyzji są odczytywane jako pola liczbowe w arkuszu aplikacji Insights.
Data/czas
Kolumny daty/czasu mogą zawierać wartości tylko daty, tylko czasu lub daty i czasu.
Aby skonwertować kolumnę na typ danych daty/czasu, wymagany jest format daty/czasu. Domyślnym formatem daty/czasu jest ISO 8601. Jeśli w danych nie jest używany format ISO 8601, należy zmienić format w polu Format niestandardowy na zgodny z istniejącymi danymi.
Notatka:
We wszystkich datach i czasach w jednej kolumnie musi być stosowany ten sam format. Sprawdzoną metodą jest uwzględnienie komponentu kropki w przypadku wszystkich wartości czasu, w których używany jest zegar 12-godzinny, aby zapewnić użycie poprawnego czasu.
Podczas określania formatu daty/czasu można korzystać z następujących zmiennych:
Komponent daty/czasu | Zmienna | Obsługiwane wartości |
---|---|---|
Miesiąc | MM | Od 01 do 12 |
M | Od 1 do 12 | |
Dzień | DD | Od 01 do 31 |
D | Od 1 do 31 | |
Rok | YYYY | Rok zapisany czterema cyframi |
YY | Rok zapisany dwiema cyframi (od 00 do 99) | |
Godzina | HH | 00 do 24 |
H | 0 do 24 | |
hh | Od 01 do 12 | |
h | Od 1 do 12 | |
Minuta | mm | 00 do 59 |
m | 0 do 59 | |
Sekunda | ss | 00 do 59 |
S | 0 do 59 | |
Okres | A | AM, PM lub obsługiwany format kropkowy zależny od bieżących ustawień regionalnych. |
a | ||
Strefa czasowa | ZZ | +HHmm lub -HHmm |
TZD | +hh:mm lub -hh:mm |
Filtruj wartości
W filtrach atrybutów używane są zapytania usuwające zbędne dane z zestawu danych. Możesz użyć narzędzia Filtruj wartości w celu ograniczenia rozmiaru zestawu danych i uwzględnienia tylko tych danych, które są istotne dla analizy. Na przykład można usunąć wpisy z wartościami pustymi lub odfiltrować wyłącznie dane dotyczące określonego analizowanego obszaru bądź zakresu dat.
Aby przefiltrować wartości, wykonaj następujące czynności:
- Otwórz skoroszyt w aplikacji Insights desktop i w razie potrzeby dodaj dane.
- Kliknij strzałkę znajdującą się obok nazwy kolumny, aby rozwinąć menu narzędzi kolumny.
Notatka:
Jeśli widokiem jest tylko model lub mapa, kliknij przycisk Pokaż tabelę .
- Wybierz opcję Filtruj wartości.
- Aby przefiltrować kolumny, wykonaj jedną z następujących czynności:
- W przypadku kolumn zawierających ciągi znakowe zaznacz unikalne wartości, które chcesz wyświetlać bądź wykluczać, lub usuń ich zaznaczenie.
- W przypadku kolumn zawierających liczby lub wskaźniki/współczynniki dostosuj suwak, ustawiając go na początkową i końcową wartość zakresu, lub kliknij węzły i podaj nową wartość.
- W przypadku kolumn zawierających wartości daty/czasu użyj przycisków kalendarza i zegara w celu dostosowania początkowej oraz końcowej daty i godziny. Datę lub czas można także wpisać bezpośrednio w filtrze.
Więcej informacji na temat stosowania ustawień filtrowania dla poszczególnych typów danych można znaleźć w sekcji Filtrowanie danych.
- Kliknij przycisk Zastosuj.
Filtr zostanie zastosowany, a niezgodne z nim wiersze zostaną usunięte.
Znajdź i zastąp
Notatka:
Narzędzie Znajdź i zastąp jest obecnie dostępne tylko dla kolumn zawierających ciągi znakowe. Aby zastąpić wartości w kolumnach zawierających liczby lub wartości daty/czasu, należy skonwertować kolumnę na ciąg znakowy, zastąpić dany ciąg znakowy i skonwertować kolumnę z powrotem na oryginalny typ danych.
Narzędzie Znajdź i zastąp jest używane do wyszukiwania konkretnych wartości w kolumnie i zastępowania ich nową wartością. Narzędzia tego można używać m.in. do zastępowania symboli zastępczych lub wartości domyślnych wartościami pustymi, do poprawiania błędnie wpisanych ciągów znakowych lub do uspójniania użycia wielkich i małych liter.
Wykonaj następujące czynności, aby znaleźć i zastąpić wartości:
- Otwórz skoroszyt w aplikacji Insights desktop i w razie potrzeby dodaj dane.
- Kliknij strzałkę znajdującą się obok nazwy kolumny, aby rozwinąć menu narzędzi kolumny.
Notatka:
Jeśli widokiem jest tylko model lub mapa, kliknij przycisk Pokaż tabelę .
- Wybierz opcję Znajdź i zastąp.
- Aby znaleźć i zastąpić wartości, wykonaj następujące czynności:
- W przypadku ciągów niestandardowych pozostań na karcie Ciąg (domyślna) i w polu tekstowym Znajdź wpisz ciąg niestandardowy do wyszukania w kolumnie. Opcjonalnie wybierz opcję Dopasuj, uwzględniając wielkość liter, aby podczas wyszukiwania uwzględniać wielkość liter, oraz opcję Dopasuj tylko całe słowo, aby zwracać tylko w pełni zgodne ciągi znakowe.
- W przypadku pustych ciągów znakowych kliknij kartę Pusty ciąg.
- W przypadku wartości pustych kliknij kartę Pusta wartość.
- Podaj wartość zastępującą, wykonując jedną z następujących czynności:
- W polu Zastąp elementem wpisz ciąg znakowy, który ma zastąpić zgodne ciągi znakowe.
- Pozostaw pole Zastąp elementem puste, aby zastępować pustymi ciągami znakowymi.
- Aby zastąpić puste ciągi znakowe wartościami pustymi (karta Pusty ciąg), wybierz opcję Zastąp wartością pustą.
- Opcjonalnie kliknij przycisk Znajdź, aby wyszukać i wyróżnić zgodne ciągi znakowe.
- Kliknij przycisk Zastąp, aby wyszukać i zastąpić zgodne ciągi znakowe.
- Powtarzaj powyższe czynności, aby znaleźć i zastąpić dodatkowe ciągi znakowe, lub kliknij przycisk Gotowe, aby zamknąć okno dialogowe.
Zgodne ciągi znakowe zostaną zaktualizowane.
Usuń kolumnę
Używaj narzędzia Usuń kolumnę, aby wykluczać zbędne kolumny z wynikowego zestawu danych. Usuniętej kolumny nie można później wyświetlić podczas analizy za pomocą opcji Pokaż ukryte pola. Usuwanie kolumny ma wpływ wyłącznie na wynikowy zestaw danych i nie powoduje usunięcia kolumny ze źródłowego zestawu danych.
Notatka:
Zestawy danych w skoroszytach danych muszą mieć co najmniej jedną kolumnę. Narzędzie Usuń kolumnę jest wyłączone w przypadku zestawów danych z tylko jedną kolumną.
Wykonaj poniższe czynności, aby usunąć kolumnę z zestawu danych:
- Otwórz skoroszyt w aplikacji Insights desktop i w razie potrzeby dodaj dane.
- Kliknij strzałkę znajdującą się obok nazwy kolumny, aby rozwinąć menu narzędzi kolumny.
Notatka:
Jeśli widokiem jest tylko model lub mapa, kliknij przycisk Pokaż tabelę .
- Wybierz opcję Usuń kolumnę.
Kolumna zostaje usunięta z tabeli.
Pokaż podsumowanie kolumny
Narzędzie Pokaż podsumowanie kolumny tworzy diagram rozkładu i oblicza statystykę użycia danych z kolumny. Podsumowanie ułatwia znajdowanie problemów w danych takich jak błędnie zapisane ciągi znakowe lub elementy odstające.
Notatka:
Narzędzie Pokaż podsumowanie kolumny tworzy wizualizację wartości w kolumnie, a nie zmienia tych wartości. Narzędzie Pokaż podsumowanie kolumny nie jest dodawane do modelu danych.
Wykonaj następujące czynności, aby utworzyć podsumowanie kolumny:
- Otwórz skoroszyt w aplikacji Insights desktop i w razie potrzeby dodaj dane.
- Kliknij strzałkę znajdującą się obok nazwy kolumny, aby rozwinąć menu narzędzi kolumny.
Notatka:
Jeśli widokiem jest tylko model lub mapa, kliknij przycisk Pokaż tabelę .
- Kliknij opcję Pokaż podsumowanie kolumny.
Zostaje wyświetlony panel boczny zawierający diagram i statystykę kolumny.
Kolumny zawierające ciągi znakowe
W przypadku kolumn zawierających ciągi znakowe tworzone jest podsumowanie w postaci diagramu słupkowego. Na diagramie słupkowym wyświetlane są unikalne wartości w kolumnie wraz z liczbą obiektów, natomiast podsumowanie zawiera statystyki łącznej liczby obiektów, liczby wartości pustych, liczby pustych ciągów znakowych oraz łącznej liczby unikalnych wartości. W razie potrzeby można za pomocą suwaka z boku diagramu zwiększyć powiększenie i wyświetlić tylko unikalne wartości. Przycisk Sortuj umożliwia posortowanie diagramu rosnąco, malejąco lub w kolejności alfabetycznej.
W podsumowaniu diagramu słupkowego można dokonywać wyborów, klikając poszczególne słupki. Wybory w kolumnie podsumowania są odzwierciedlone w widoku tabeli lub mapy, jeśli ma to zastosowanie.
Oto potencjalne problemy w podsumowaniu kolumny zawierającej ciągi znakowe:
- Czy kolumna zawiera wartości puste i puste ciągi znakowe? Wartości puste i puste ciągi znakowe są analizowane osobno. Narzędzie Znajdź i zastąp umożliwia zastąpienie wartości pustych pustymi ciągami znakowymi lub odwrotnie.
- Czy we wszystkich wartościach wielkie i małe litery są używane w spójny sposób? Niespójne stosowanie wielkich i małych liter może doprowadzić do niepoprawnego oddzielenia wartości, które powinny zostać zagregowane jako pojedyncza unikalna wartość. Za pomocą narzędzia Znajdź i zastąp można wyszukać ciąg znakowy bez rozróżniania wielkości liter i zastąpić wszystkie pasujące wartości jedną wartością.
- Czy kolumna zawiera błędnie zapisane wartości? Niespójność zapisu może skutkować niepoprawnymi agregacjami. Za pomocą narzędzia Znajdź i zastąp można wyszukać niepoprawnie zapisaną wartość i zastąpić ją wartością poprawną.
Kolumny liczbowe
W przypadku kolumn liczbowych podsumowanie ma postać histogramu. W histogramie liczby są agregowane w koszach i wyświetlane są częstotliwości występowania wartości w poszczególnych koszach. Na histogramie wyświetlane są wartości średniej i mediany, natomiast podsumowanie zawiera statystyki łącznej liczby obiektów, liczby wartości pustych, wartości średniej, przybliżonej mediany, górnego i dolnego kwartyla, odchylenia standardowego, asymetrii oraz kurtozy dodatkowej. Liczbę koszy w histogramie można zmienić za pomocą suwaka znajdującego się pod osią X.
W podsumowaniu histogramu można dokonywać wyborów, klikając poszczególne słupki. Wybory w podsumowaniu histogramu są odzwierciedlone w widoku tabeli lub mapy, jeśli ma to zastosowanie.
Oto potencjalne problemy w podsumowaniu kolumny zawierającej liczby:
- Czy zestaw danych zawiera elementy odstające lub wartości spoza oczekiwanego zakresu? Jeśli na przykład kolumna zawiera wartości procentowe, oczekiwanym zakresem są wartości od 0 do 100. Do usunięcia wierszy z niepoprawnymi wartościami można użyć narzędzia Filtruj wartości.
- Czy rozkład danych jest normalny? W przypadku niektórych analiz statystycznych, takich jak Utwórz model regresji, wymagane jest, aby dane miały rozkład normalny. Za pomocą narzędzia Oblicz kolumnę można zastosować do kolumny transformację.
- Czy zestaw danych zawiera symbole zastępcze lub wartości domyślne, które powinny zostać usunięte (na przykład 9999)? Odpowiednio do potrzeb można za pomocą narzędzia Znajdź i zastąp zastąpić te wartości wartościami pustymi lub za pomocą narzędzia Filtruj wartości usunąć wiersze zawierające symbole zastępcze bądź wartości domyślne.
Notatka:
Narzędzie Znajdź i zastąp obsługuje obecnie tylko kolumny zawierające ciągi znakowe. Konieczne jest skonwertowanie kolumny liczbowej na ciągi znakowe, zastąpienie ciągu znakowego, a następnie skonwertowanie kolumny z powrotem na typ liczbowy (liczby całkowite lub liczby podwójnej precyzji).
Kolumny daty/czasu
W przypadku kolumny daty/czasu tworzone jest podsumowanie szeregów czasowych. Szeregi czasowe pozwalają zagregować wartości daty/czasu w przedziałach i wyświetlić liczbę wartości w każdym przedziale. Podsumowanie zawiera łączną liczbę obiektów, datę minimalną, datę maksymalną oraz liczbę wartości pustych. Za pomocą suwaka znajdującego się nad szeregiem czasowym można zwiększyć powiększenie i wyświetlić diagram bardziej szczegółowy. Jeśli poziom powiększenia przekroczy wymagany próg, odstęp czasu zostanie odpowiednio zaktualizowany.
Aby dokonywać wyborów w podsumowaniu szeregów czasowych, należy klikać poszczególne punkty w czasie. Wybory w podsumowaniu szeregów czasowych są odzwierciedlone w widoku tabeli lub mapy, jeśli ma to zastosowanie.
Oto potencjalne problemy w podsumowaniu kolumny zawierającej daty/czas:
- Czy daty przypadają na wymagany zakres dat? Za pomocą narzędzia Filtruj wartości można zachować tylko wartości przypadające na wymagany zakres daty/czasu.
- Czy zestaw danych zawiera symbole zastępcze lub wartości domyślne, które powinny zostać usunięte (na przykład 1000-01-01)? Odpowiednio do potrzeb można za pomocą narzędzia Znajdź i zastąp zastąpić te wartości wartościami pustymi lub za pomocą narzędzia Filtruj wartości usunąć wiersze zawierające symbole zastępcze bądź wartości domyślne.
Notatka:
Narzędzie Znajdź i zastąp obsługuje obecnie tylko kolumny zawierające ciągi znakowe. Konieczne jest skonwertowanie kolumny daty/czasu na ciągi znakowe, zastąpienie ciągu znakowego, a następnie skonwertowanie kolumny z powrotem na typ daty/czasu.