マルチファイル フィーチャ コネクションの作成 (Create Multifile Feature Connection) (GeoAnalytics Desktop)

サマリー

マルチファイル フィーチャ コネクション ファイル (*.mfc) とアイテムを作成します。 マルチファイル フィーチャ コネクション (MFC) に登録されているデータセットは、GeoAnalytics Desktop ツールや、他のジオプロセシング ツールへの入力として使用できます。

使用法

  • このツールを使用して 1 つ以上のデータセットと接続し、ジオプロセシング ツールへの入力として使用できます。

    注意:

    必要に応じて、[新しいマルチファイル フィーチャ コネクション] ダイアログを使用してマルチファイル フィーチャ コネクションを作成できます。

  • マルチファイル フィーチャ コネクションは次のデータセットをサポートしています。

    • 区切りファイル (*.csv、*.tsv、および *.txt)
    • シェープファイル (*.shp)
    • パーケット ファイル (*.parquet)
      注意:

      暗号化されていないパーケット ファイルのみをサポートしています。

    • ORC ファイル (*.orc)

    サポートされているファイル タイプの詳細については、「マルチファイル フィーチャ コネクション」をご参照ください。

  • データセットを MFC 内で入力として使用するには、データを正しく構成する必要があります。 MFC 用データを作成するには、登録する単一のソース フォルダー内にあるサブフォルダーとしてデータセットをフォーマットします。 このソース フォルダーで、サブフォルダーの名前はデータセット名を表します。

    3 つのデータセット サブフォルダーを持つ 1 つのソース フォルダー
    それぞれがデータセットを表す 3 つのサブフォルダーを持つソース フォルダーを示します。

    上に示す画像は MFC の正しい構造を表します。 ソース フォルダーが登録されており、ソース フォルダー内の各サブフォルダーはデータセットを表します。 この例では、ソース フォルダーを登録し、データセット-1、データセット-2、データセット-3 の 3 つのデータセットが MFC 内に含まれています。

    「ビッグ データ コネクションの構造化」の詳細

  • [データ ソース フォルダー] パラメーターを使用して、MFC を作成する元の場所を指定します。

  • MFC は自分のコンピューターにローカルにも、ネットワーク ドライブにも保存できます。 MFC を共有する場合、ソースの場所がすべてのユーザーからアクセス可能なことを確認してください。 ソース フォルダーには MFC を保存しないことをお勧めします。

  • プロジェクトの MFC にアクセスするには、保存されている MFC の場所をフォルダー接続として追加します。

  • ジオメトリまたは時間の表示設定では、ジオメトリや時間がデータセットから削除されることはありません。 時間とジオメトリの設定は常に適用されます。 たとえば、latitude および longitude という 2 つのフィールドによって表されたジオメトリを含むポイント データセットが存在する場合、表示設定はデータセットを次のように操作します。

    • [表示] - latitude フィールドおよび longitude フィールドを、ジオプロセシング ツールのパラメーターおよび結果で使用できます。
    • [非表示] - latitude フィールドおよび longitude フィールドを、ジオプロセシング ツールのパラメーターおよび出力結果で使用できません。

    いずれの場合も、データセットのジオメトリは latitude フィールドおよび longitude フィールドで定義されます。

  • ジオメトリを WKT などの長い文字列値で表す場合、ジオメトリのフィールドは [非表示] に設定することをお勧めします。

  • *.mfc ファイルを手動で変更することはお勧めしません。 *.mfc ファイルには次のプロパティがあります。

    • コネクション情報 - ソースのパス
    • データセット情報 - データセットの名前、タイプ、フィールド、ジオメトリなど

  • ツールのメッセージには、見つかったデータベースとそのステータスに関する次の情報が含まれています。

    • 成功 - 新しいデータセットが見つかり、MFC に追加されました
    • 失敗 - このデータセットは MFC に正しく追加されませんでした

    MFC 内のデータセットを探しているとき、次の 2 つの問題が起きることがあります:

    • 予期していたデータセットが見当たらない。 この場合、サブフォルダーを含むソース フォルダーとして指定したパスが正しく、データ タイプをサポートしていることを確認します。
    • 1 つ以上のデータセットが登録できない。 データセットを登録できない場合、次の点を確認します。

      問題解決策

      データセットが予期した形式ではない。

      ファイルを開き、予期した形式であるか確認します。 データが正しく構成されていない場合、更新して再度登録します。

      .csv ファイルにはデータについて数行の記述とサマリーがあるのみで、残りは空白行となっています。

      フォルダー内にあるデータセットのスキーマが一致しない。

      データセット フォルダー内のファイルはすべて同じスキーマを持つ必要があります。 ファイルを開き、スキーマを比較します。 一致しないスキーマがあれば削除し、データセットを再度登録します。

      ある .csv ファイルは 10 個のフィールドがあり、別のファイルは 8 個のフィールドがある。

      フォルダー内にあるデータセットのファイル タイプが一致しない。

      データセット フォルダー内のファイルはすべて同じエクステンション (ファイル タイプ) である必要があります。 データ ソースがある場所のファイル タイプを確認し、適切でないファイルは削除または移動します。

      シェープファイルのデータセットがパーケット ファイルと同じフォルダーにある。

      認識されないフィールド形式がある。

      ORC やパーケットが予期しない形式の場合に起こることがあります。 有効なフィールド形式を使用してください。

      不明なフィールド形式のパーケット ファイルがある。

    MFC ファイルへのデータセット追加が失敗する理由の詳細

  • MFC を作成したら、次のツールを使用してコネクション情報とデータセットを変更できます。

  • ジオプロセシング ツールは、Spark を活用しています。 マルチファイル フィーチャ コネクションの詳細と、その使用方法については、「マルチファイル フィーチャ コネクション」をご参照ください。

パラメーター

ラベル説明データ タイプ
マルチファイル フィーチャ コネクションの出力場所
(オプション)

*.mfc ファイルが作成されるフォルダー。

Folder
出力マルチファイル フィーチャ コネクションの名前

作成する *.mfc ファイルの名前。

String
コネクション タイプ

作成するコネクションのタイプ。

  • フォルダーファイル システムの場所に接続します。 これがデフォルトです。
String
データ ソース フォルダー
(オプション)

MFC に登録するデータセットを含むフォルダー。

Folder
ジオメトリ フィールドの表示
(オプション)

MFC ファイルを他のジオプロセシング ツールへの入力として使用するときに、ジオメトリを指定するために使用されるフィールドが、フィールドとして表示されるかどうかを指定します。 ジオメトリ フィールドが表示されない場合でも、ジオメトリはデータセットに適用されます。 ジオメトリの表示設定は、MFC で変更できます。

  • オン - ジオメトリ フィールドは、解析のフィールドとして含まれます。 これがデフォルトです。
  • オフ - ジオメトリ フィールドは、解析のフィールドとして含まれません。

Boolean
時間フィールドの表示
(オプション)

MFC ファイルを他のジオプロセシング ツールへの入力として使用するときに、時間を指定するために使用されるフィールドが、フィールドとして表示されるかどうかを指定します。 時間フィールドが表示されない場合でも、時間はデータセットに適用されます。 時間の表示設定は、MFC で変更できます。

  • オン - 時間フィールドは、解析のフィールドとして含まれます。 これがデフォルトです。
  • オフ - 時間フィールドは、解析のフィールドとして含まれません。

Boolean

派生した出力

ラベル説明データ タイプ
出力 MFC

作成される *.mfc ファイル。

File

arcpy.geoanalytics.CreateBDC({bdc_location}, bdc_name, connection_type, {data_source_folder}, {visible_geometry}, {visible_time})
名前説明データ タイプ
bdc_location
(オプション)

*.mfc ファイルが作成されるフォルダー。

Folder
bdc_name

作成する *.mfc ファイルの名前。

String
connection_type

作成するコネクションのタイプ。

  • FOLDERファイル システムの場所に接続します。 これがデフォルトです。
String
data_source_folder
(オプション)

MFC に登録するデータセットを含むフォルダー。

Folder
visible_geometry
(オプション)

MFC ファイルを他のジオプロセシング ツールへの入力として使用するときに、ジオメトリを指定するために使用されるフィールドが、フィールドとして表示されるかどうかを指定します。 ジオメトリ フィールドが表示されない場合でも、ジオメトリはデータセットに適用されます。 ジオメトリの表示設定は、MFC で変更できます。

  • GEOMETRY_VISIBLEジオメトリ フィールドは、解析のフィールドとして含まれます。 これがデフォルトです。
  • GEOMETRY_NOT_VISIBLEジオメトリ フィールドは、解析のフィールドとして含まれません。
Boolean
visible_time
(オプション)

MFC ファイルを他のジオプロセシング ツールへの入力として使用するときに、時間を指定するために使用されるフィールドが、フィールドとして表示されるかどうかを指定します。 時間フィールドが表示されない場合でも、時間はデータセットに適用されます。 時間の表示設定は、MFC で変更できます。

  • TIME_VISIBLE時間フィールドは、解析のフィールドとして含まれます。 これがデフォルトです。
  • TIME_NOT_VISIBLE時間フィールドは、解析のフィールドとして含まれません。
Boolean

派生した出力

名前説明データ タイプ
output_bdc

作成される *.mfc ファイル。

File

コードのサンプル

CreateBDC (スタンドアロンのスクリプト)

次の Python スクリプトは、CreateBDC 関数の使用方法を示しています。

# Name: CreateBigDataConnection.py
# Description: Establishes a connection to a folder location containing one or 
#              more datasets. Datasets will be used as input to GeoAnalytics 
#              Desktop Tools.
#
# Requirements: ArcGIS Pro Advanced License

# Import system modules
import arcpy

# Set local variables
sourceFolder = r"\\FileShare\MyLargeDatasets"
outName = "my_new_MultifileFeatureConnection"
outFolder = r"c:\Projects\MyProjectFolder"
time = "TIME_NOT_VISIBLE"
geometry = "GEOMETRY_VISIBLE"

# Run Create Multifile Feature Connection
arcpy.gapro.CreateBDC(outFolder, outName, "FOLDER", sourceFolder, geometry, time)

環境

このツールは、ジオプロセシング環境を使用しません。