数据加载工作空间概念

创建数据加载工作空间工具可创建数据加载工作空间、数据参考工作簿和映射工作簿。

数据加载工作空间

数据加载工作空间包含文件夹、Microsoft Excel 工作簿,以及可帮助将数据从源方案映射到目标方案的其他项目。 下面介绍数据加载工作空间的文件夹结构。

  • Data Mapping 文件夹包含以下文件夹,具体取决于源数据:
    • Points - 包含已映射的每个源点数据集的工作簿。
    • Polygons - 包含已映射的每个源面数据集的工作簿。
    • Polylines - 包含已映射的每个源折线数据集的工作簿。
    • Table - 包含已映射的每个源表数据集的工作簿。
    • GlobalLookup - 包含可用于创建要在所有映射工作簿中使用的查找表的 GlobalLookup.xlsx 工作簿。
  • Scripts 文件夹包含以下脚本文件,您可以使用自定义函数来处理数据。 这些函数可以在映射工作簿的 Expression 列中使用。
    • base.py—在映射工作簿中使用此文件中的基本函数。
    • shape_operations.py—在映射工作簿中使用该文件的形状操作函数。
    • user.py—使用此文件来实现自定义功能。
  • Domains 文件夹包含工作簿,其中包含源工作空间和目标工作空间中所有域的模式信息。
  • DataReference.xlsx 文件包含源、目标和映射工作簿的路径以及数据加载设置。

数据参考工作簿

数据参考工作簿包括源、目标和映射工作簿的路径。 如果其中任何项目的位置发生更改,您可以手动更新路径。 其他列控制如何将数据从源加载到目标,包括某些地理处理环境设置

以下是列定义:

  • Source—源数据集位置。
  • SourceDefinitionQuery—编写 SQL 查询以选择要映射到目标数据集的源数据集的子集。 例如,使用 Type = 0 以仅选择属性类型等于 0 的记录加载到目标数据集中。
  • Target—目标数据集位置。
  • TargetDeleteQuery—编写 SQL 查询以在加载之前有选择地从目标数据集中删除数据。 例如,1=1 删除目标数据集中的所有现有数据。
  • MappingWorkbook—数据加载工作空间中数据映射工作簿位置的链接。
  • Enabled—True 或 False 值指定在数据加载过程中是否处理或跳过映射工作簿。 默认值为 True。
  • MaintainAttachments—True 或 False 值指定在数据加载过程中是否保留附件。 默认值为 True。
  • PreserveGlobalIds—True 或 False 值指定在数据加载过程中是否保留全局 ID。 默认值为 False。 当加载到服务时,无法保留全局 ID。
  • GeographicTransformations—加载数据时定义要使用的有效地理变换

数据映射工作簿

数据映射工作簿位于数据映射文件夹中,并按几何类型组织。 每个数据映射工作簿对应于数据参考工作簿中定义的源对和目标对之一。 使用这些工作簿可以使用下述选项定义如何将数据从源映射到目标。

映射工作表

使用此工作表定义字段映射。 工作表在工作簿中以绿色高亮显示。

以下是列定义:

  • TargetField—目标数据集的字段。
  • FieldType—目标数据集中每个字段的字段类型。
  • Expression—通过从下拉菜单中选择字段或编写Python表达式来直接映射字段。 例如,这可以引用外部 Python 函数或常量值(例如数字或字符串)。
  • LookupSheet—指定查找工作表。 这必须与 LookupKeysLookupValue 列一起使用。
  • LookupKeys—指定查找工作表中的一列或多列用作键。 要使用多列,请用逗号分隔它们。
  • LookupValue—指定查找工作表中要用作目标值的列。
  • LookupDefault—使用查找工作表时,此字段可用于定义默认值。 空值和查找工作表中不匹配的值将分配该值。 此列可选,如果不使用默认值,则可以留空。

查找工作表

使用查找工作表定义源到目标值映射。 它们在映射工作表中用作查找键和查找值。 系统会自动为源数据中的所有编码值属性域创建一个工作表,其中的列包含域代码和描述。 可以手动添加表示源数据中字段的其他列以支持多值查找。 这些工作表在工作簿中以蓝色高亮显示。

如果创建数据加载工作空间工具的预测字段匹配选项参数设置为属性域编码值描述相似性,则将在源域和目标域之间自动生成查找工作表。 将首先添加源数据列,然后添加任何匹配的目标数据列。

模式工作表

使用这些工作表查看有关源数据集和目标数据集的模式信息。 它们用于构建映射工作空间,但不用于处理。 这些工作表在工作簿中以黄色高亮显示。

信息工作表

使用此工作表可以选择定义源子类型值。 此工作表在工作簿中以橙色高亮显示。

数据映射选项

数据映射工作簿中有许多用于映射数据的选项。 可以使用 LookupExpression 列,但每个目标字段只能使用一种方法。 查看所有选项以确定最适合数据加载过程的选项。 下面描述的选项在映射工作表中配置。

表达式

Expression 列可用于直接映射具有兼容数据类型的字段。 如果某些源字段和目标字段具有相同的字段名称,则会自动匹配。 检查所有自动匹配的字段以验证源数据类型和目标数据类型是否匹配,以及如果存在编码域,则值是否相等。

Expression 列还可以自定义为使用直接写入 ExcelPython 表达式或调用 Scripts 文件夹中的函数。 以下是最佳选项的场景:

  • 将字段值转换为不同的数据类型
  • 将所有源值映射到一个目标值
  • 创建全局唯一标识符 (GUID)
  • 执行形状操作以在几何类型之间进行转换