Nota:
Ingegneria dei Dati disponibile in Insights desktop. Tutti Insights in ArcGIS Online e Insights in ArcGIS Enterprise utenti hanno accesso a Insights desktop. Per ulteriori informazioni, vedere Panoramica di ArcGIS Insights.
L'ingegneria dati è al momento in anteprima.
Gli strumenti del menu Importa opzioni sono applicati ai dataset quando vengono aggiunti a una cartella di lavoro dei dati, ma non sono aggiunti al modello dati.
Strumenti di importazione
I seguenti strumenti sono disponibili quando si importa un dataset in una cartella dei dati:
Strumento | Descrizione |
---|---|
Applica un filtro avanzato al dataset e seleziona i campi da includere nel dataset campione. | |
Tagliare spazi vuoti | Rimuove gli spazi vuoti dall'inizio o dalla fine del valore della stringa. Lo strumento è abilitato di default. |
Scegliere come viene creato il campione del dataset. Questo strumento è disponibile per i dataset con oltre di 250.000 record. |
Usare le opzioni di importazione
Completare i seguenti passaggi per applicare gli strumenti di importazione in un dataset:
- Aprire la finestra Aggiungi alla pagina tramite una delle seguenti opzioni:
- Creare una cartella di lavoro dei dati. Compare la finestra Aggiungi alla pagina una volta che la cartella di lavoro dei dati è stata creata.
- Fare clic sul pulsante Aggiungi alla pagina sopra il riquadro dei dati in una cartella di lavoro dei dati esistente.
- Selezionare un dataset da aggiungere alla cartella di lavoro dei dati.
- Cliccare sulle Opzioni di importazione per accedere ai seguenti strumenti:
- Scegliere Filtrare dataset per applicare un filtro avanzato e selezionare i campi da includere nel dataset campione.
- Scegliere se rimuovere spazi vuoti dall'inizio e dalla fine delle stringhe (funzione abilitata di default).
- Se il tuo dataset ha più di 250.000 record, scegli se usare il metodo di campionamento Casuale (default) o Fisso .
- Fare clic su Aggiungi.
Metodi di campionamento
Ci sono due metodi per la creazione di dati campionati: Casuale e Fisso.
Casuale
Il metodo di campionamento Casuale seleziona 250.000 registri a caso dal dataset. Questo metodo probabilmente creerà un campione rappresentativo di valori unici e range numerici. Tuttavia, i valori con relativamente poche occorrenze potrebbero non essere selezionati nel campione. Per esempio, un errore di battitura in una colonna a stringhe che appare solo una volta potrebbe non essere selezionato nel campione casuale, in questo modo non saprai come correggere l'errore di battitura come parte del tuo flusso di lavoro di ingegneria dei dati.
Il metodo Casuale è il metodo di campionamento preferito per la maggior parte dei dataset.
Nota:
I connettori del database che non sono supportati immediatamente devono avere file di configurazione aggiornati per supportare la campionatura casuale. Se non utilizzi i file di configurazione più recenti per un connettore, devi rimuovere la tipologia del connettore e in seguito aggiungere nuovamente il connettore con i file più recenti.
Le connessioni solo dati a ArcGIS Enterprise non supportano il campionamento casuale se Insights 2022.2 o versione successiva non è installato nell'organizzazione.
La campionatura casuale potrebbe non essere supportata per i dati dalle tabelle pubbliche Living Atlas e ArcGIS .
Fisso
Il metodo Fisso seleziona i registri nell'ordine in cui arrivano nel dataset. La dimensione del campione di default è di 250.000 registri, ma puoi aumentare o diminuire suddetta dimensione quando importi il dataset.
Utilizza il metodo Fisso quando vuoi aumentare le dimensioni del campione, o quando hai un set dati che ti fornirà un campione rappresentativo tramite i registri nell'ordine in cui appaiono.
Non utilizzare il metodo Fisso per i dataset che sono ordinati in un modo che ha un impatto con i valori che esistono nel campione. Per esempio, un dataset ha dati climatici raccolti per diversi anni in uno stato, ma i primi 250.000 registri includono solo i primi due mesi di dati. Pertanto, i dati non rappresenteranno i dati, le temperature, la quantità di precipitazioni, e altre condizioni climatiche registrate nel dataset completo.