Notatka:
Inżynieria danych jest dostępna w aplikacji Insights desktop. Do aplikacji Insights desktop mają dostęp wszyscy użytkownicy aplikacji Insights in ArcGIS Online i Insights in ArcGIS Enterprise. Więcej informacji można znaleźć w temacie Przegląd aplikacji ArcGIS Insights.
Inżynieria danych jest obecnie dostępna w wersji przedpremierowej.
Narzędzia kolumn są używane do wprowadzania zmian w danych w konkretnej kolumnie, a dostęp do nich jest uzyskiwany z poszczególnych kolumn w tabelach pod modelem. Narzędzia kolumn są dodawane do modelu danych po ich zastosowaniu.
Konwertuj typ danych
Typy danych są stosowane do każdej kolumny w aplikacji Insights. W zależności od formatowania danych wejściowych domyślny typ danych może nie być poprawny dla wszystkich kolumn. Na przykład pliki .csv nie obsługują formatowania daty/czasu, dlatego wszystkie kolumny daty/czasu są importowane jako ciągi znakowe.
Kolumny można konwertować na takie typy danych jak: ciąg znakowy, liczba całkowita, liczba podwójnej precyzji lub data/czas.
Wykonaj następujące czynności, aby użyć narzędzia Konwertuj typ danych:
- Otwórz skoroszyt w aplikacji Insights desktop i w razie potrzeby dodaj dane.
- Kliknij strzałkę znajdującą się obok nazwy kolumny, aby rozwinąć menu narzędzi kolumny.
Notatka:
Jeśli Twoim widokiem jest tylko model lub mapa, kliknij przycisk Pokaż tabelę .
- Wybierz opcję Konwertuj typ danych.
- W polu Typ danych wynikowych wybierz typ danych, na który chcesz skonwertować kolumnę i zastosuj odpowiednie opcje formatowania:
- Jeśli konwertujesz kolumnę na datę/czas, wpisz format daty/czasu.
- Jeśli konwertujesz na liczbę całkowitą lub liczbę podwójnej precyzji, wybierz typ separatora dziesiętnego używany w danych (kropka lub przecinek).
- Kliknij przycisk Zastosuj.
Kolumna zostanie skonwertowana na wybrany typ danych.
Liczba całkowita
Całkowitoliczbowe typy danych to liczby bez wartości po przecinku.
Każdą kolumnę zawierającą liczby można skonwertować na typ liczb całkowitych. Jeśli kolumna zawiera znaki, które nie należą do zapisu liczbowego, są one usuwane.
Jeśli kolumna zawiera wartości dziesiętne, cyfry po przecinku są usuwane, a liczba całkowita nie jest zaokrąglana. Aby zaokrąglić liczbę, należy skonwertować kolumnę na liczby podwójnej precyzji i obliczyć nową kolumnę za pomocą funkcji ROUND().
Całkowitoliczbowe typy danych są odczytywane jako pola liczbowe w arkuszu aplikacji Insights.
Podwójnej precyzji
Typy danych podwójnej precyzji (lub zmiennoprzecinkowe o podwójnej precyzji) to liczby, które mogą zawierać wartości dziesiętne.
Każdą kolumnę zawierającą liczby można skonwertować na typ liczb podwójnej precyzji. Jeśli kolumna zawiera znaki, które nie należą do zapisu liczbowego, są one usuwane.
Typy danych podwójnej precyzji są odczytywane jako pola liczbowe w arkuszu aplikacji Insights.
Data/czas
Kolumny daty/czasu mogą zawierać wartości tylko daty, tylko czasu lub daty i czasu.
Aby skonwertować kolumnę na typ danych daty/czasu, wymagany jest format daty/czasu. Domyślnym formatem daty/czasu jest ISO 8601. Jeśli w danych nie jest używany format ISO 8601, należy zmienić format w polu Format niestandardowy na zgodny z istniejącymi danymi.
Notatka:
We wszystkich datach i czasach w jednej kolumnie musi być stosowany ten sam format. Sprawdzoną metodą jest uwzględnienie komponentu kropki w przypadku wszystkich wartości czasu, w których używany jest zegar 12-godzinny, aby zapewnić użycie poprawnego czasu.
Podczas określania formatu daty/czasu można korzystać z następujących zmiennych:
Komponent daty/czasu | Zmienna | Obsługiwane wartości |
---|---|---|
Miesiąc | MM | Od 01 do 12 |
M | Od 1 do 12 | |
Dzień | DD | Od 01 do 31 |
D | Od 1 do 31 | |
Rok | YYYY | Rok zapisany czterema cyframi |
YY | Rok zapisany dwiema cyframi (od 00 do 99) | |
Godzina | HH | 00 do 24 |
H | 0 do 24 | |
hh | Od 01 do 12 | |
h | Od 1 do 12 | |
Minuta | mm | 00 do 59 |
m | 0 do 59 | |
Sekunda | ss | 00 do 59 |
S | 0 do 59 | |
Okres | A | AM, PM lub obsługiwany format kropkowy zależny od bieżących ustawień regionalnych. |
a | ||
Strefa czasowa | ZZ | +HHmm lub -HHmm |
TZD | +hh:mm lub -hh:mm |
Filtruj wartości
W filtrach atrybutów używane są zapytania usuwające zbędne dane z zestawu danych. Tego narzędzia można używać w celu ograniczenia rozmiaru zestawu danych i uwzględnienia tylko tych danych, które są istotne dla analizy. Na przykład można usunąć wpisy z wartościami pustymi lub odfiltrować wyłącznie dane dotyczące określonego analizowanego obszaru bądź zakresu dat.
Wykonaj następujące czynności, aby użyć narzędzia Filtruj wartości:
- Otwórz skoroszyt w aplikacji Insights desktop i w razie potrzeby dodaj dane.
- Kliknij strzałkę znajdującą się obok nazwy kolumny, aby rozwinąć menu narzędzi kolumny.
Notatka:
Jeśli Twoim widokiem jest tylko model lub mapa, kliknij przycisk Pokaż tabelę .
- Wybierz opcję Filtruj wartości.
- Wykonaj jedną z następujących operacji:
- Aby filtrować kolumny zawierające ciągi znakowe, zaznacz unikalne wartości, które chcesz wyświetlać bądź wykluczać, lub usuń ich zaznaczenie.
- Aby filtrować kolumny zawierające liczby lub wskaźniki/współczynniki, dostosuj suwak, ustawiając go na początkową i końcową wartość zakresu, lub kliknij węzły i podaj nową wartość.
- Aby filtrować kolumny zawierające wartości daty/czasu, użyj przycisków kalendarza i zegara w celu dostosowania początkowej oraz końcowej daty i godziny. Datę lub czas można także wpisać bezpośrednio w filtrze.
Więcej informacji na temat stosowania ustawień filtrowania dla poszczególnych typów danych można znaleźć w sekcji Filtrowanie danych.
- Kliknij przycisk Zastosuj.
Filtr zostanie zastosowany, a niezgodne z nim wiersze zostaną usunięte.
Znajdź i zastąp
Notatka:
Narzędzie Znajdź i zastąp jest obecnie dostępne dla kolumn zawierających ciągi znakowe. Aby zastąpić wartości w kolumnach zawierających liczby lub wartości daty/czasu, należy skonwertować kolumnę na ciąg znakowy, zastąpić dany ciąg znakowy i skonwertować kolumnę z powrotem na oryginalny typ danych.
Narzędzie Znajdź i zastąp jest używane do wyszukiwania konkretnych wartości w kolumnie i zastępowania ich nową wartością. Narzędzia tego można używać m.in. do zastępowania symboli zastępczych lub wartości domyślnych wartościami pustymi, do poprawiania błędnie wpisanych ciągów znakowych lub do uspójniania użycia wielkich i małych liter.
Wykonaj następujące czynności, aby użyć narzędzia Znajdź i zastąp:
- Otwórz skoroszyt w aplikacji Insights desktop i w razie potrzeby dodaj dane.
- Kliknij strzałkę znajdującą się obok nazwy kolumny, aby rozwinąć menu narzędzi kolumny.
Notatka:
Jeśli Twoim widokiem jest tylko model lub mapa, kliknij przycisk Pokaż tabelę .
- Wybierz opcję Znajdź i zastąp.
- Wykonaj jedną z następujących operacji:
- Aby znaleźć i zastąpić niestandardowe ciągi znakowe, pozostań na karcie Ciąg znakowy (domyślna). W polu Znajdź wpisz niestandardowy ciąg znakowy do wyszukania w kolumnie. W zależności od potrzeb wybierz opcję Dopasuj, uwzględniając wielkość liter, aby podczas wyszukiwania uwzględniać wielkość liter, oraz opcję Dopasuj tylko całe słowo, aby zwracać tylko w pełni zgodne ciągi znakowe.
- Aby znaleźć i zastąpić puste ciągi znakowe, kliknij kartę Pusty ciąg.
- Aby znaleźć i zastąpić wartości puste, kliknij kartę Pusta wartość.
- W polu Zastąp elementem wpisz ciąg znakowy, którym chcesz zastąpić zgodne ciągi znakowe. Pozostaw pole Zastąp elementem, aby zastępować pustymi ciągami znakowymi. W przypadku zastępowania pustych ciągów znakowych wartościami pustymi (karta Pusty ciąg), wybierz opcję Zastąp wartością pustą.
- Opcjonalnie kliknij przycisk Znajdź, aby wyszukać i wyróżnić zgodne ciągi znakowe.
- Kliknij przycisk Zastąp, aby wyszukać i zastąpić zgodne ciągi znakowe.
- Powtórz te czynności, aby znaleźć i zastąpić dodatkowe ciągi znakowe, lub kliknij przycisk Gotowe, aby zamknąć okno dialogowe.
Zgodne ciągi znakowe zostaną zaktualizowane.
Usuń kolumnę
Narzędzie Usuń kolumnę jest używane do wykluczania zbędnych kolumn z wynikowego zestawu danych. Usuniętej kolumny nie można później wyświetlić podczas analizy za pomocą opcji Pokaż ukryte pola. Usuwanie kolumny ma wpływ wyłącznie na wynikowy zestaw danych i nie powoduje usunięcia kolumny ze źródłowego zestawu danych.
Notatka:
Zestawy danych w skoroszytach danych muszą mieć co najmniej jedną kolumnę. Opcja Usuń kolumnę jest wyłączona w przypadku zestawów danych z jedną kolumną.
Wykonaj poniższe czynności, aby usunąć kolumnę z zestawu danych.
- Otwórz skoroszyt w aplikacji Insights desktop i w razie potrzeby dodaj dane.
- Kliknij strzałkę znajdującą się obok nazwy kolumny, aby rozwinąć menu narzędzi kolumny.
Notatka:
Jeśli Twoim widokiem jest tylko model lub mapa, kliknij przycisk Pokaż tabelę .
- Wybierz opcję Usuń kolumnę.
Kolumna zostaje usunięta z tabeli.
Pokaż podsumowanie kolumny
Narzędzie Pokaż podsumowanie kolumny tworzy diagram rozkładu i oblicza statystykę użycia danych z kolumny. Podsumowanie ułatwia znajdowanie problemów w danych takich jak błędnie zapisane ciągi znakowe lub elementy odstające.
Notatka:
Narzędzie Pokaż podsumowanie kolumny tworzy wizualizację wartości w kolumnie, a nie zmienia tych wartości. Dlatego narzędzie Pokaż podsumowanie kolumny nie jest dodawane do modelu danych.
Wykonaj następujące czynności, aby utworzyć podsumowanie kolumny:
- Otwórz skoroszyt w aplikacji Insights desktop i w razie potrzeby dodaj dane.
- Kliknij strzałkę znajdującą się obok nazwy kolumny, aby rozwinąć menu narzędzi kolumny.
Notatka:
Jeśli Twoim widokiem jest tylko model lub mapa, kliknij przycisk Pokaż tabelę .
- Kliknij opcję Pokaż podsumowanie kolumny.
Zostaje wyświetlony panel boczny zawierający diagram i statystykę kolumny.
Kolumny zawierające ciągi znakowe
W przypadku kolumn zawierających ciągi znakowe tworzone jest podsumowanie w postaci diagramu słupkowego. Na diagramie słupkowym wyświetlane są unikalne wartości w kolumnie wraz z liczbą obiektów, natomiast podsumowanie zawiera statystyki łącznej liczby obiektów, liczby wartości pustych, liczby pustych ciągów znakowych oraz łącznej liczby unikalnych wartości. W razie potrzeby można za pomocą suwaka znajdującego się obok diagramu zwiększyć powiększenie i wyświetlić tylko unikalne wartości. Przycisk Sortuj umożliwia posortowanie diagramu rosnąco, malejąco lub alfabetycznie.
W podsumowaniu diagramu słupkowego można dokonywać wyborów, klikając poszczególne słupki. Wybory w kolumnie podsumowania są odzwierciedlone w widoku tabeli lub mapy, jeśli ma to zastosowanie.
W podsumowaniu kolumny zawierającej ciągi znakowe można wyszukiwać następujące problemy:
- Czy kolumna zawiera wartości puste i puste ciągi znakowe? Wartości puste i puste ciągi znakowe są analizowane osobno. Narzędzie Znajdź i zastąp umożliwia zastąpienie wartości pustych pustymi ciągami znakowymi lub odwrotnie.
- Czy we wszystkich wartościach wielkie i małe litery są używane w spójny sposób? Niespójne stosowanie wielkich i małych liter może doprowadzić do niepoprawnego oddzielenia wartości, które powinny zostać zagregowane jako pojedyncza unikalna wartość. Za pomocą narzędzia Znajdź i zastąp można wyszukać niespójnie stosowane wielkie i małe litery w ciągu znakowym i zastąpić wszystkie pasujące wartości jedną wartością.
- Czy kolumna zawiera błędnie zapisane wartości? Niespójność zapisu może skutkować niepoprawnymi agregacjami. Za pomocą narzędzia Znajdź i zastąp można wyszukać niepoprawnie zapisaną wartość i zastąpić ją wartością poprawną.
Kolumny liczbowe
W przypadku kolumn liczbowych podsumowanie ma postać histogramu. W histogramie liczby są agregowane w koszach i wyświetlane są częstotliwości występowania wartości w poszczególnych koszach. Na histogramie wyświetlane są wartości średniej i mediany, natomiast podsumowanie zawiera statystyki łącznej liczby obiektów, liczby wartości pustych, wartości średniej, przybliżonej mediany, górnego i dolnego kwartyla, odchylenia standardowego, asymetrii oraz kurtozy dodatkowej. Liczbę koszy w histogramie można zmienić za pomocą suwaka znajdującego się pod osią X.
W podsumowaniu histogramu można dokonywać wyborów, klikając poszczególne słupki. Wybory w podsumowaniu histogramu są odzwierciedlone w widoku tabeli lub mapy, jeśli ma to zastosowanie.
W podsumowaniu kolumny liczbowej można wyszukiwać następujące problemy:
- Czy zestaw danych zawiera elementy odstające lub wartości spoza oczekiwanego zakresu? Jeśli na przykład kolumna zawiera wartości procentowe, oczekiwanym zakresem są wartości od 0 do 100. Do usunięcia wierszy z niepoprawnymi wartościami można użyć narzędzia Filtruj wartości.
- Czy rozkład danych jest normalny? W przypadku niektórych analiz statystycznych, takich jak Utwórz model regresji, wymagane jest, aby dane miały rozkład normalny. Za pomocą narzędzia Oblicz kolumnę można zastosować do kolumny transformację.
- Czy zestaw danych zawiera symbole zastępcze lub wartości domyślne, które powinny zostać usunięte (na przykład 9999)? Odpowiednio do potrzeb można za pomocą narzędzia Znajdź i zastąp zastąpić te wartości wartościami pustymi lub za pomocą narzędzia Filtruj wartości usunąć wiersze zawierające symbole zastępcze bądź wartości domyślne.
Notatka:
Narzędzie Znajdź i zastąp obsługuje obecnie tylko kolumny zawierające ciągi znakowe. Konieczne jest skonwertowanie kolumny liczbowej na ciągi znakowe, zastąpienie ciągu znakowego, a następnie skonwertowanie kolumny z powrotem na typ liczbowy (liczby całkowite lub liczby podwójnej precyzji).
Kolumny daty/czasu
W przypadku kolumny daty/czasu tworzone jest podsumowanie szeregów czasowych. Szeregi czasowe pozwalają zagregować wartości daty/czasu w przedziałach i wyświetlić liczbę wartości w każdym przedziale. Podsumowanie zawiera łączną liczbę obiektów, datę minimalną, datę maksymalną oraz liczbę wartości pustych. Za pomocą suwaka znajdującego się nad szeregiem czasowym można zwiększyć powiększenie i wyświetlić diagram bardziej szczegółowy. Jeśli poziom powiększenia przekroczy wymagany próg, odstęp czasu zostanie odpowiednio zaktualizowany.
W podsumowaniu szeregów czasowych można dokonywać wyborów, klikając poszczególne punkty w czasie. Wybory w podsumowaniu szeregów czasowych są odzwierciedlone w widoku tabeli lub mapy, jeśli ma to zastosowanie.
W podsumowaniu kolumny daty/czasu można wyszukiwać następujące problemy:
- Czy daty przypadają na wymagany zakres dat? Za pomocą narzędzia Filtruj wartości można zachować tylko wartości przypadające na wymagany zakres daty/czasu.
- Czy zestaw danych zawiera symbole zastępcze lub wartości domyślne, które powinny zostać usunięte (na przykład 1000-01-01)? Odpowiednio do potrzeb można za pomocą narzędzia Znajdź i zastąp zastąpić te wartości wartościami pustymi lub za pomocą narzędzia Filtruj wartości usunąć wiersze zawierające symbole zastępcze bądź wartości domyślne.
Notatka:
Narzędzie Znajdź i zastąp obsługuje obecnie tylko kolumny zawierające ciągi znakowe. Konieczne jest skonwertowanie kolumny daty/czasu na ciągi znakowe, zastąpienie ciągu znakowego, a następnie skonwertowanie kolumny z powrotem na typ daty/czasu.