Skip To Content

透视表

“透视表”工具通过使用现有字段中的不同值将较长的数据集转换为较宽的数据集,以创建新字段。

示例

“透视表”工具可用于以下场景:

  • 您拥有一个包含大量记录和少量字段的长数据集,并且希望将其格式化为包含少量记录和大量字段。
  • 您拥有一个包含多年实地观测记录的数据集,并且希望按年份对值进行汇总。

参数

下表概述了“透视表”工具中的参数:

参数描述

输入数据集

要进行透视表操作的数据集。

输入字段

一个或多个字段,用于定义输出数据集中的唯一记录。 将使用聚合函数对具有匹配值的记录进行聚合。

透视表字段

字段,其中包含将在输出数据集中变换到新字段中的值。

值字段

字段,用于确定新记录的值。

聚合函数

用于计算新值的一个或多个函数。

用法说明

可以使用输入数据集参数来标识将进行转变的数据集。

可以使用输入字段参数来标识一个或多个字段,其中包含作为分组依据的值。 一个或多个指定字段中的唯一值将成为输出数据集中的记录。 无法同时针对输入字段透视表字段值字段指定相同字段。

可以使用透视表字段参数来标识包含相应值的字段,这些值将用于在输出数据集中创建新字段名称。

聚合函数参数用于确定计算已分组记录中的值的方式。 以下聚合函数可用:

  • 总和 - 字段内数值的总和。 [null, 1, 3] 的总和为 4
  • 最小值 - 数值或日期字段的最小值。 [0, 2, null] 的最小值为 0
  • 最大值 - 数值或日期字段的最大值。 [0, 2, null] 的最大值为 2
  • 平均值 - 数值的平均值。 [0, 2, null] 的平均值为 1
  • 标准差 - 数值字段的标准差。 [null, 1, 1, 1] 的标准差为 0
  • 计数 - 非空值的数目。 可以在任何类型的字段上使用。 [null, "hello", "world"] 的计数为 2
  • 任何 - 任何类型的字段中的示例值。

输出

工具输出是包含以下字段和值的数据集:

  • 使用输入字段参数指定的所有字段。 输出将包含在字段或字段组合中找到的每个唯一值的一个记录。
  • 使用透视表字段参数指定的字段中每个唯一值的新字段。 这些字段将包含使用值字段参数指定的字段的聚合值。 例如,如果透视表字段包含 2 个唯一值:CaliforniaWashington,并且计算 MeanAny 的聚合函数,则结果将包含 4 个新字段:MEAN_CaliforniaANY_CaliforniaMEAN_WashingtonANY_Washington

如果透视表字段包含 null 值,则将添加字段 null。 如果透视表字段包含空字符串,则将添加字段 _

使用“透视表”的示例

局限性

以下是“透视表”工具的已知局限性:

  • 字段名称不区分大小写。如果透视表字段参数包含具有不同大小写形式的匹配文本值,则将对输出字段进行重命名以避免重复。
  • 将对包含无效字符或者以数字开头的字段名称进行重命名。 如果透视表字段参数包含多个值,在进行重命名时这些值会发生冲突,则将对其进行重命名以避免重复。
  • 透视表字段参数最多支持 1,000 个不同的值。 如果找到超过 1,000 个不同的值,则将引发错误。
  • 透视表需要扫描整个输入数据集以确定新的字段值。 如果下游工具的性能成为问题,请考虑限制输入数据集的大小。

许可要求

需要以下许可和配置:

  • CreatorProfessional 用户类型
  • 发布者、服务商或管理员角色,或等效的自定义角色

有关 Data Pipelines 要求的详细信息,请参阅要求