Opzioni di importazione

Insights desktop
Nota:

Ingegneria dei Dati disponibile in Insights desktop. Tutti gli utenti di Insights in ArcGIS Online e Insights in ArcGIS Enterprise hanno accesso a Insights desktop. Per ulteriori informazioni, consultare Introduzione a ArcGIS Insights.

L'ingegneria dati è al momento in anteprima.

Gli strumenti del menu Importa opzioni sono applicati ai dataset quando vengono aggiunti a una cartella di lavoro dei dati, ma non sono aggiunti al modello dati.

Strumenti di importazione

I seguenti strumenti sono disponibili quando si importa un dataset in una cartella dei dati:

StrumentoDescrizione

Filtra dataset

Applica un filtro avanzato al dataset e seleziona i campi da includere nel dataset campione.

Tagliare spazi vuoti

Rimuove gli spazi vuoti dall'inizio o dalla fine del valore della stringa. Lo strumento è abilitato di default.

Metodo di campionamento

Scegliere come viene creato il campione del dataset. Questo strumento è disponibile per i dataset con oltre di 250.000 record.

Usare le opzioni di importazione

Completare i seguenti passaggi per applicare gli strumenti di importazione in un dataset:

  1. Aprire la finestra Aggiungi alla pagina effettuando una delle seguenti operazioni:
    • Creare una cartella di lavoro dei dati. Compare la finestra Aggiungi alla pagina una volta che la cartella di lavoro dei dati è stata creata.
    • Fare clic sul pulsante Aggiungi alla pagina sopra il riquadro dei dati in una cartella di lavoro dei dati esistente.
  2. Selezionare un dataset da aggiungere alla cartella di lavoro dei dati.
  3. Fare clic su Opzioni di importazione per effettuare le seguenti operazioni:
    • Scegliere Filtrare dataset per applicare un filtro avanzato e selezionare i campi da includere nel dataset campione.
    • Scegliere se rimuovere spazi vuoti dall'inizio e dalla fine delle stringhe (funzione abilitata di default).
    • Se il dataset contiene più di 250.000 record, scegliere se usare il metodo di campionamento Casuale (default) o Fisso.
  4. Fare clic su Aggiungi.

Metodi di campionamento

Ci sono due metodi per la creazione di dati campionati: Casuale e Fisso.

Casuale

Il metodo di campionamento Casuale seleziona 250.000 registri a caso dal dataset. Questo metodo probabilmente creerà un campione rappresentativo di valori unici e range numerici. Tuttavia, i valori con relativamente poche occorrenze potrebbero non essere selezionati nel campione. Per esempio, un errore di battitura in una colonna a stringhe che appare solo una volta potrebbe non essere selezionato nel campione casuale, in questo modo non saprai come correggere l'errore di battitura come parte del tuo flusso di lavoro di ingegneria dei dati.

Il metodo Casuale è il metodo di campionamento preferito per la maggior parte dei dataset.

Nota:

I connettori del database che non sono supportati immediatamente devono avere file di configurazione aggiornati per supportare la campionatura casuale. Se non si utilizzano i file di configurazione più recenti per un connettore, è necessario rimuovere il tipo di connettore esistente e aggiungere nuovamente il connettore con i file più recenti.

Le connessioni solo dati a ArcGIS Enterprise non supportano il campionamento casuale se Insights 2022.2 o versione successiva non è installato nell'organizzazione.

La campionatura casuale potrebbe non essere supportata per i dati dalle tabelle pubbliche Living Atlas e ArcGIS .

Fisso

Il metodo Fisso seleziona i registri nell'ordine in cui arrivano nel dataset. La dimensione del campione di default è di 250.000 registri, ma puoi aumentare o diminuire suddetta dimensione quando importi il dataset.

Utilizza il metodo Fisso quando vuoi aumentare le dimensioni del campione, o quando hai un set dati che ti fornirà un campione rappresentativo tramite i registri nell'ordine in cui appaiono.

Non utilizzare il metodo Fisso per i dataset che sono ordinati in un modo che ha un impatto con i valori che esistono nel campione. Per esempio, un dataset ha dati climatici raccolti per diversi anni in uno stato, ma i primi 250.000 registri includono solo i primi due mesi di dati. In questo caso, i dati non saranno rappresentativi di date, temperature, quantità di precipitazioni e altre condizioni climatiche registrate nel dataset completo.