フィールド統計 → テーブル (Field Statistics To Table) (データ管理)

サマリー

テーブルまたはフィーチャクラスにある 1 つ以上の入力フィールドの説明的な統計のテーブルを作成します。

フィールド統計 → テーブル ツールの図

使用法

  • このツールはフィーチャクラスまたはスタンドアロン テーブルを入力として受け付けます。

  • [入力フィールド] パラメーターでは、統計を計算できる複数のフィールドを指定できます。 このパラメーターは数値 (Short、Long、Big Integer、Float、Double のいずれかのタイプ)、テキスト、日付 (Date、Date Only、Time Only、Timestamp Offset) の各タイプ フィールドを受け付けます。

  • [入力フィールド] パラメーターで指定してフィールドの順番が出力テーブルの行の順番になります。

  • 指定したフィールドの各個別値について、入力フィールド統計を個別に計算するために [フィールドでグループ化] パラメーターが使用されます。 各入力フィールドの統計が計算され、グループの個別値ごとにフィールド別に 1 回報告されます。

  • [出力テーブル] パラメーターの [フィールド タイプ] 列には次の 4 つのオプションがあります。

    • [すべて] - フィールド タイプに関係なく、すべての入力フィールドと出力統計が 1 つの出力テーブルにエクスポートされます。
    • [数値] - 数値タイプ入力フィールド (Short、Long、Float、Big Integer、Double) だけがエクスポートされ、数値フィールド タイプに適用できる統計だけが出力テーブルにエクスポートされます。
    • [テキスト] - テキスト タイプ入力フィールドだけがエクスポートされ、テキスト フィールド タイプに適用できる統計だけが出力テーブルにエクスポートされます。
    • [日付] - 日付タイプ入力フィールド (Date、Date Only、Time Only、Timestamp Offset) だけがエクスポートされ、日付フィールド タイプに適用できる統計だけが出力テーブルにエクスポートされます。

    各出力テーブルでは、[出力テーブル] パラメーターの [出力名] 列でテーブルの名前が指定され、[出力場所] パラメーターで指定したワークスペースにテーブルが保存されます。

  • 出力統計とフィールド名は [出力統計] パラメーターを使用して構成できます。 このパラメーターに値を指定しなかった場合、適用可能なすべての出力統計が出力テーブルに含まれます。 以下のテーブルは、[出力テーブル] パラメーターの [フィールド タイプ] 列の各オプションで利用できる統計と対応する出力フィールド タイプをまとめたものです。

    出力統計すべて数値TextDate

    フィールド名

    Text

    Text

    Text

    Text

    エイリアス

    Text

    Text

    Text

    Text

    フィールド タイプ

    Text

    Text

    Text

    Text

    Null

    Long

    Long

    Long

    Long

    最小

    Text

    Double

    -

    Date

    最大

    Text

    Double

    -

    Date

    平均

    Text

    Double

    -

    Date

    標準偏差

    Double

    Double

    -

    -

    中央値

    Text

    Double

    -

    Date

    個数

    Long

    Long

    Long

    Long

    個別値の数

    Long

    Long

    Long

    Long

    モード

    Text

    Double

    Text

    Date

    最少頻値

    Text

    Double

    Text

    Date

    外れ値

    Long

    Long

    -

    -

    合計

    Double

    Double

    -

    -

    範囲

    Text

    Double

    -

    Text

    四分位範囲

    Double

    Double

    -

    -

    第一四分位

    Text

    Double

    -

    Date

    第三四分位

    Text

    Double

    -

    Date

    変動係数

    Double

    Double

    -

    -

    歪度

    Double

    Double

    -

    -

    尖度

    Double

    Double

    -

    -

  • 利用可能な統計は、[データ エンジニアリング] ビューで利用できるものと同じです。 各統計の計算方法の詳細については、「統計情報の操作」をご参照ください。

  • [出力テーブル] パラメーターの [フィールド タイプ] 列で [すべて] を選択した場合、すべてのフィールド タイプが 1 つのテーブルにエクスポートされます。 すべての入力フィールドと統計を一度で可視化する場合にこれが便利です。 これによって一部の用途でメリットがもたらされます。たとえば、レイアウトやレポートで統計を使用する場合などが挙げられます。 ただし、1 つのテーブルとしてさまざまなフィールド タイプをエクスポートする際には注意点があります。 [最頻値][最少頻値][最小値][最大値] など、複数のフィールド タイプに共通する一部の統計オプションは、出力テーブルでテキスト フィールドとして保存されます。 これにより、統計列でのこれらの値の並べ替えやモデルでの出力統計の変更などで問題が発生する場合があります。 また、一部の統計はテキスト フィールドまたは日付フィールドに適用されないため、テーブルに空のセルが発生します。

  • [出力テーブル] パラメーターの [フィールド タイプ] 列で [数値][テキスト]、または [日付] を選択した場合、各フィールド タイプがそれぞれ別のテーブルにエクスポートされ、出力テーブルにはそのフィールド タイプに適用可能な統計だけが含まれます。 複数のフィールド タイプに適用される一部の統計は、入力フィールド タイプと一致する形式で保存されます。 たとえば、数値テーブルでは [最小] フィールドのタイプが Double になり、日付テーブルではタイプが日付になります。 さまざまな出力テーブルを用意しておくことをお勧めします。 たとえば、入力フィールドと同じタイプとして統計を保存するには、出力テーブルで統計を並べ替えるか、モデルでこれらの値を使用します。

  • 同数の値が複数ある場合、[出力統計] パラメーターの [統計] 列の [最頻値][最少頻値] オプションを入力フィールドの複数の値に関連付けることができます。 このような場合、数値、テキスト、日付の各出力テーブルでは複数の値が <Null> として報告されます。 [すべて] オプションの場合、出力セルにはテキスト「複数の値」が含まれます。

パラメーター

ラベル説明データ タイプ
入力テーブル

統計テーブルの作成に使用するフィールドを含む入力テーブル。

Table View
入力フィールド

統計の計算に使用する値を含むフィールド。

Field
出力場所

出力テーブルを作成する場所。 場所にはジオデータベース、フォルダー、またはフィーチャ データセットを指定できます。

Workspace
出力テーブル

統計を含む出力テーブル。 [フィールド タイプ] 列では各出力テーブルに含めるフィールド タイプを指定し、各出力テーブルの名前は [出力名] 列で指定します。 たとえば、すべてのフィールド タイプのサマリーを含む 1 つのテーブルを作成したり、数値、テキスト、日付の各フィールド タイプごとにテーブルを作成したりできます。

[フィールド タイプ] 列では次のオプションを使用できます。

  • [数値] - 入力 (Short、Long、Big Integer、Float、Double のいずれかのタイプ) の数値フィールドをサマリー処理するテーブルが作成されます。
  • [テキスト] - 入力 (テキスト タイプ) のテキスト フィールドのサマリー処理を行うテーブルが作成されます。
  • [日付] - 入力 (Date、Date Only、Time Only、Timestamp Offset のいずれかのタイプ) の日付フィールドのサマリー処理を行うテーブルが作成されます。
  • [すべて] - 入力のすべての数値、テキスト、日付の各フィールドのサマリー処理を行うテーブルが作成されます。 複数のフィールド タイプに適用される統計を含む出力フィールドがテキスト タイプとして保存されます。 テキスト タイプ フィールドと日付タイプ フィールドに適用されない出力統計は空になります。

Value Table
フィールドでグループ化
(オプション)

行をカテゴリにグループ化するのに使用するフィールド。 フィールドでグループ化を指定した場合、フィールドでグループ化の個別地ごとに、入力の各フィールドが出力テーブルに行として 1 回表示されます。

Field
出力統計
(オプション)

サマリー処理される統計、および統計を含む出力フィールドの名前を指定します。 統計は [統計] 列で指定し、出力フィールドの名前は [出力フィールド名] 列で指定します。 値を指定しなかった場合、適用可能なすべての統計がすべての入力フィールドに対して計算されます。

[統計] 列では次のオプションを使用できます (入力フィールドに適用可能な統計だけが利用できます)。

  • [フィールド名] - フィールドの名前。
  • [エイリアス] - フィールドのエイリアス。
  • [フィールド タイプ] - フィールドのフィールド タイプ (Short、Long、Double、Float、テキスト、または日付)
  • [NULL] - フィールドの NULL 値を含むレコード件数。
  • [最小値] - フィールドの最小値。
  • [最大値] - フィールドの最大値。
  • [平均値] - フィールド内のすべての値の平均値 (合計を合計数で割った値)。 日付フィールドの平均日付を計算する際、ミリ秒単位で計算された日付と基準日 (例: 1900-01-01) との差を計算することで、各日付が数値に変換されます。
  • [標準偏差] - フィールドの値の標準偏差。 分散の平方根として計算され、分散はフィールドの平均値から各値までの差の二乗の平均です。
  • [中央値] - フィールド内のすべての値の中央値。 中央値とは、並べ替えた値のリストで中央に位置する値を示します。 値の数が偶数の場合、中央値は分布内の 2 つの中央値の平均値となります。
  • [個数] - フィールド内の NULL 値でない値の数。
  • [個別値の数] - フィールド内の個別値の数。
  • [最頻値] - フィールド内で最もよく存在する値。
  • [最少頻値] - フィールド内の最も一般的でない値。
  • [外れ値] - フィールドに外れ値を含むレコード件数。 外れ値は、フィールドの値の第三四分位以上または第一四分位以下の四分位範囲の 1.5 倍以上の値を指します。
  • [合計] - フィールド内のすべての値の合計。
  • [範囲] - フィールド内の最大値と最小値の差。
  • [四分位範囲] - フィールド内の値の第一四分位から第三四分位の範囲。 データの中央の範囲を表しています。
  • [第一四分位] - フィールドの第一四分位の値。 四分位は、並べ替えられた値のリストを、同数の値が含まれる 4 つのグループに分割します。 第一四分位は、昇順での第 1 グループの上限値です。
  • [第三四分位] - フィールドの第三四分位の値。 四分位は、並べ替えられた値のリストを、同数の値が含まれる 4 つのグループに分割します。 第三四分位は、昇順での第 3 グループの上限値です。
  • [変動係数] - フィールド内の値の変動係数。 変動係数は、値の相対的な広がりを示す尺度です。 標準偏差をフィールドの平均値で割った値として計算されます。
  • [歪度] - フィールド内の値の歪度。 歪度は、分布の対称性の尺度です。 歪度は、3 次モーメント (データ値の 3 乗の平均) を標準偏差の 3 乗で割って計算されます。
  • [尖度] - フィールド内の値の尖度。 尖度は、正規分布の裾と比較した分布の裾の重さを表し、極値の頻度を特定するのに役立ちます。 尖度は、4 次モーメント (データ値の平均の 4 乗) を標準偏差の 4 乗で割って計算されます。

Value Table

派生した出力

ラベル説明データ タイプ
数値フィールドの出力テーブル

数値データ タイプの出力テーブル。 [出力場所] パラメーターで指定したワークスペースにテーブルが保存されます。

Table
テキスト フィールドの出力テーブル

テキスト データ タイプの出力テーブル。 [出力場所] パラメーターで指定したワークスペースにテーブルが保存されます。

Table
日付フィールドの出力テーブル

日付データ タイプの出力テーブル。 [出力場所] パラメーターで指定したワークスペースにテーブルが保存されます。

Table
すべてのフィールドの出力テーブル

すべてのデータ タイプの出力テーブル。 [出力場所] パラメーターで指定したワークスペースにテーブルが保存されます。

Table

arcpy.management.FieldStatisticsToTable(in_table, in_fields, out_location, out_tables, {group_by_field}, {out_statistics})
名前説明データ タイプ
in_table

統計テーブルの作成に使用するフィールドを含む入力テーブル。

Table View
in_fields
[in_fields,...]

統計の計算に使用する値を含むフィールド。

Field
out_location

出力テーブルを作成する場所。 場所にはジオデータベース、フォルダー、またはフィーチャ データセットを指定できます。

Workspace
out_tables
[[field_type, output_name],...]

統計を含む出力テーブル。 field_type 列では各出力テーブルに含めるフィールド タイプを指定し、各出力テーブルの名前は output_name 列で指定します。 たとえば、すべてのフィールド タイプのサマリーを含む 1 つのテーブルを作成したり、数値、テキスト、日付の各フィールド タイプごとにテーブルを作成したりできます。

field_type 列では次のオプションを使用できます。

  • NUMERIC - 入力 (Short、Long、Big Integer、Float、Double のいずれかのタイプ) の数値フィールドをサマリー処理するテーブルが作成されます。
  • TEXT - 入力 (テキスト タイプ) のテキスト フィールドのサマリー処理を行うテーブルが作成されます。
  • DATE - 入力 (Date、Date Only、Time Only、Timestamp Offset のいずれかのタイプ) の日付フィールドのサマリー処理を行うテーブルが作成されます。
  • ALL - 入力のすべての数値、テキスト、日付の各フィールドのサマリー処理を行うテーブルが作成されます。 複数のフィールド タイプに適用される統計を含む出力フィールドがテキスト タイプとして保存されます。 テキスト タイプ フィールドと日付タイプ フィールドに適用されない出力統計は空になります。

Value Table
group_by_field
(オプション)

行をカテゴリにグループ化するのに使用するフィールド。 フィールドでグループ化を指定した場合、フィールドでグループ化の個別地ごとに、入力の各フィールドが出力テーブルに行として 1 回表示されます。

Field
out_statistics
[[out_statistic, output_name],...]
(オプション)

サマリー処理される統計、および統計を含む出力フィールドの名前を指定します。 統計は out_statistic 列で指定し、出力フィールドの名前は output_name 列で指定します。 値を指定しなかった場合、適用可能なすべての統計がすべての入力フィールドに対して計算されます。

out_statistic 列では次の選択肢が使用できます (入力フィールドに適用可能な統計だけが利用できます)。

  • FIELDNAME - フィールドの名前。
  • ALIAS - フィールドのエイリアス。
  • FIELDTYPE - フィールドのフィールド タイプ (Short、Long、Double、Float、テキスト、または日付)。
  • NULLS - フィールドの NULL 値を含むレコード件数。
  • MINIMUM - フィールドの最小値。
  • MAXIMUM - フィールドの最大値。
  • MEAN - フィールド内のすべての値の平均値 (合計を合計数で割った値)。 日付フィールドの平均日付を計算する際、ミリ秒単位で計算された日付と基準日 (例: 1900-01-01) との差を計算することで、各日付が数値に変換されます。
  • STANDARDDEVIATION - フィールド内の値の標準偏差。 分散の平方根として計算され、分散はフィールドの平均値から各値までの差の二乗の平均です。
  • MEDIAN - フィールド内のすべての値の中央値。 中央値とは、並べ替えた値のリストで中央に位置する値を示します。 値の数が偶数の場合、中央値は分布内の 2 つの中央値の平均値となります。
  • COUNT - フィールド内の NULL 値でない値の数。
  • NUMBEROFUNIQUEVALUES - フィールド内の個別値の数。
  • MODE - フィールド内で最もよく存在する値。
  • LEASTCOMMON - フィールド内の最も一般的でない値。
  • OUTLIERS - フィールドに外れ値を含むレコード件数。 外れ値は、フィールドの値の第三四分位以上または第一四分位以下の四分位範囲の 1.5 倍以上の値を指します。
  • SUM - フィールド内のすべての値の合計。
  • RANGE - フィールド内の最大値と最小値の差。
  • INTERQUARTILERANGE - フィールド内の値の第一四分位から第三四分位の範囲。 データの中央の範囲を表しています。
  • FIRSTQUARTILE - フィールドの第一四分位の値。 四分位は、並べ替えられた値のリストを、同数の値が含まれる 4 つのグループに分割します。 第一四分位は、昇順での第 1 グループの上限値です。
  • THIRDQUARTILE - フィールドの第三四分位の値。 四分位は、並べ替えられた値のリストを、同数の値が含まれる 4 つのグループに分割します。 第三四分位は、昇順での第 3 グループの上限値です。
  • COEFFICIENTOFVARIATION - フィールド内の値の変動係数。 変動係数は、値の相対的な広がりを示す尺度です。 標準偏差をフィールドの平均値で割った値として計算されます。
  • SKEWNESS - フィールド内の値の歪度。 歪度は、分布の対称性の尺度です。 歪度は、3 次モーメント (データ値の 3 乗の平均) を標準偏差の 3 乗で割って計算されます。
  • KURTOSIS - フィールド内の値の尖度。 尖度は、正規分布の裾と比較した分布の裾の重さを表し、極値の頻度を特定するのに役立ちます。 尖度は、4 次モーメント (データ値の平均の 4 乗) を標準偏差の 4 乗で割って計算されます。

Value Table

派生した出力

名前説明データ タイプ
out_numeric

数値データ タイプの出力テーブル。 [出力場所] パラメーターで指定したワークスペースにテーブルが保存されます。

Table
out_text

テキスト データ タイプの出力テーブル。 [出力場所] パラメーターで指定したワークスペースにテーブルが保存されます。

Table
out_date

日付データ タイプの出力テーブル。 [出力場所] パラメーターで指定したワークスペースにテーブルが保存されます。

Table
out_all

すべてのデータ タイプの出力テーブル。 [出力場所] パラメーターで指定したワークスペースにテーブルが保存されます。

Table

コードのサンプル

FieldStatisticsToTable の例 1 (Python ウィンドウ)

次の Python ウィンドウ スクリプトは、FieldStatisticsToTable 関数の使用方法を示しています。

import arcpy
arcpy.management.FieldStatisticsToTable("SNAP_County_Rates", 
      "LocId;Program_Name;Participants;SNAP_Rate;TimeofYear", r"C:\Output.gdb", 
      "ALL All_Table;DATE Date_Table;NUMERIC Num_Table;TEXT Text_Table")
FieldStatisticsToTable の例 2 (スタンドアロン スクリプト)

次のスタンドアロン Python スクリプトで、FieldStatisticsToTable 関数を使用する方法を示します。

# Import system modules.
import arcpy

try:
    # Set the workspace and input features. 
    arcpy.env.workspace = r"C:\\Statistics\\MyData.gdb" 
    in_table = "County_Data" 
 
    # Set the input fields that will be used to calculate statistics. 
    in_fields = "population_total;unemployment_rate;income;county_name;sample_date" 
 
    # Set the output location.
    out_location = r"C:\\Statistics\\MyData.gdb"

    # Set the output table field type and name.
    out_tables = "ALL AllStats_Table;DATE DateStats_Table;NUMERIC NumStats_Table;TEXT TextStats_Table"
 
    # Run the Field Statistics To Table tool 
    arcpy.management.FieldStatisticsToTable (in_table, in_fields, out_location, out_tables) 
 
except arcpy.ExecuteError: 
    # If an error occurred when running the tool, print the error message. 
    print(arcpy.GetMessages())

環境

このツールは、ジオプロセシング環境を使用しません。

関連トピック