[属性の集計] ツールは、レコードを集約し、統計情報を計算します。 すべてのレコードを集計することも、1 つ以上のフィールドの一致する値に基づいて集計することもできます。
例
[属性の集計] ツールは、次のようなシナリオで使用できます。
- すべての販売レコードを集約し、総利益を計算する。
- アイテム タイプに基づいて販売レコードを集約し、アイテムごとの利益を計算する。
パラメーター
次の表に、[属性の集計] ツールで使用するパラメーターの概要を示します。
パラメーター | 説明 |
---|---|
入力データセット | 集計するレコードが含まれているデータセット。 |
一致するフィールド | 一致する値に基づき、レコードを集約するために使用する 1 つ以上のフィールド。 このパラメーターはオプションです。 デフォルトでは、すべてのレコードが集計されます。 |
サマリー フィールド | 集計する入力データセットのフィールドと、各フィールドに対して計算する統計。 このパラメーターはオプションです。 デフォルトでは、COUNT 統計情報が返されます。 |
使用上の注意
[入力データセット] パラメーターを使用して、集計するレコードを含むデータセットを特定します。
[一致するフィールド] パラメーターを使用して、入力レコードをグループ化する値を含む 1 つ以上のフィールドを指定します。 フィールドで集計する場合、統計は、属性値の一意の組み合わせごとに計算されます。 フィールドを指定しない場合、すべてのレコードを使用して統計情報が計算されます。
[サマリー フィールド] パラメーターを使用して、集計する入力データセットのフィールドを指定します。 次の統計サマリーが利用可能です。
- [合計] - フィールド内の数値の合計。 [null, 1, 3] の合計は 4 です。
- [最小] - 数値または日付フィールドの最小値。 [0, 2, null] の最小値は 0 です。
- [最大] - 数値または日付フィールドの最大値。 [0, 2, null] の最大値は 2 です。
- [平均] - 数値の平均。 [0, 2, null] の平均は 1 です。
- [標準偏差] - 数値フィールドの標準偏差。 [null, 1, 1, 1] の標準偏差は 0 です。
- [個数] - 非 NULL 値の数。 任意のタイプのフィールドで使用できます。 [null, "hello", "world"] の数は 2 です。
- [すべて] - 任意のタイプのフィールドのサンプル値。
出力
ツールの出力は、計算された統計情報を含むテーブルです。 出力結果には、[一致するフィールド] パラメーターを使用して指定されたフィールドのほかに、次のフィールドがあります。
フィールド名 | 説明 |
---|---|
COUNT | 新しいレコードに集計されたレコードの個数。 これは常に出力に含まれます。 |
STATISTIC_fieldname | 指定された統計がそれぞれ属性フィールドを作成し、「STATISTIC_fieldname」という形式の名前が付けられます。 例: measurement フィールドの平均値は MEAN_measurement です。 |
制限事項
[属性の集計] ツールの既知の制限事項は以下のとおりです。
ライセンス要件
次のライセンスと構成が必要です。
- Creator または Professional ユーザー タイプ
- 公開者、ファシリテーター、管理者ロール、またはそれと同等のカスタム ロール
Data Pipelines の要件の詳細については、要件をご参照ください。