ArcGIS Data Pipelines 对存储的矢量和表格数据(例如要素图层中的数据)或云或对象存储(例如 Amazon S3 和 Google BigQuery)中的数据执行批处理。Data Pipelines 提供了数据准备和工程功能,因此您可以混合和构建数据并将其集成到 ArcGIS 中。 可以使用以下工具集类别的工具执行处理:
- 清理 - 清理数据。 例如,您可以移除不需要的字段。 您也可以修改字段或填写缺失值。
- 构建 - 创建从图层的现有字段或属性派生的字段。 例如,您可以添加并计算新字段;标准化、变换或重分类现有字段;并根据输入图层的几何添加字段。
- 格式化 - 更改字段的格式或重新组织表或要素类中的字段。 例如,您可以转换时间字段、对分类字段进行编码或缩小现有字段的尺寸。
- 集成 - 将来自另一个数据源的数据集成或添加到输入表或要素类。 例如,您可以通过丰富数据来连接字段或添加字段。
- 输出数据集 - 选择要写入和存储结果的输出类型。
示例
以下是可以使用 Data Pipelines 的示例场景:
- 作为数据科学家,您可以组合不同的数据集并使用 ArcGIS Arcade 函数将变量作为字段进行计算。
- 作为 GIS 分析师,您可以构建和共享可重现的数据准备工作流。
- 作为一名环境科学家,您可以组合和标准化存储为 .csv 文件集合的外业信息。
工具
以下各部分中的表介绍了 Data Pipelines 编辑器中不同类别中的工具。
清理
清理类别包含以下工具:
构造
构建类别包含以下工具:
格式
格式化类别包含以下工具:
整合
集成类别包含以下工具:
输出数据集
支持以下输出数据集:
工具 | 描述 |
---|---|
要素图层输出将数据管道数据集写入托管要素图层或托管表。 您可以创建要素图层或表、替换现有要素图层或表中的数据,或者向现有要素图层或表添加和更新记录。 |