导入选项

Insights 桌面版
注:

Insights desktop 中提供了数据工程。 所有 Insights in ArcGIS OnlineInsights in ArcGIS Enterprise 用户都可以访问 Insights desktop。 有关详细信息,请参阅 ArcGIS Insights 概述

数据工程现在可以预览。

在将导入选项菜单中的工具添加到数据工作簿时,系统会将其应用于数据集,但不会将其添加到数据模型中。

导入工具

将数据集导入数据工作簿时可以使用以下工具:

工具描述

过滤数据集

将高级过滤器应用于数据集并选择要包含在样本数据集中的字段。

修剪空格

移除字符串值开始和末尾处的空格。 此工具默认处于启用状态。

采样方法

选择数据集样本的创建方式。 该工具可用于包含超过 250,000 条记录的数据集。

使用导入选项

完成以下步骤以将导入工具应用于数据集:

  1. 使用以下选项之一打开添加到页面窗口:
    • 创建数据工作簿。 创建数据工作簿后,随即显示添加到页面窗口。
    • 单击现有数据工作簿的数据窗格上方的添加到页面按钮。
  2. 选择要添加到数据工作簿的数据集。
  3. 单击导入选项按钮以访问以下工具:
    • 选择过滤数据集可应用高级过滤器并选择要包含在样本数据集中的字段。
    • 选择是否要修剪字符串开头和结尾处的空格(默认启用)。
    • 如果您的数据集包含超过 250,000 条记录,请选择是使用随机(默认)还是固定采样方法。
  4. 单击添加

采样方法

共有两种用于创建采样数据的方法:随机固定

随机

随机采样方法可从数据集中随机选择 250,000 条记录。 使用此方法可能创建出唯一值和数字范围的典型样本。 但是,系统可能不会在样本中选择出现次数相对较少的值。 例如,在随机采样过程中系统可能不会选择仅出现一次的字符串列中的拼写错误,因此您将无法知道需要将该拼写错误作为数据工程工作流的一部分进行修复。

随机方法是大多数数据集的首选采样方法。

注:

不支持开箱即用的数据库连接器必须具有已更新的配置文件方可支持随机采样。 如果您没有使用连接器的最新配置文件,则必须移除连接器类型,然后重新添加具有最新文件的连接器

如果组织中未安装 Insights 2022.2 或更高版本,则与 ArcGIS Enterprise 的仅数据连接将不支持随机采样。

Living AtlasArcGIS 公共选项卡中的数据可能不支持随机采样。

已修复

固定方法将按照记录在数据集中出现的顺序来选择记录。 默认采样大小为 250,000 条记录,但您可以在导入数据集时增大或减小采样大小。

当您希望增大采样大小时,或当您所拥有的数据集将提供按照记录出现的顺序使用记录的典型样本时,请使用固定方法。

请勿对以影响样本中存在的值的方式排序的数据集使用固定方法。 例如,某个数据集包含了一个国家/地区数年的天气数据,但前 250,000 条记录仅包含前两个月的数据。 因此,该数据无法代表完整数据集中记录的日期、温度、降水量和其他天气条件。