Skip To Content

ファイル

ファイル内のレコードを ArcGIS Data Pipelines への入力として使用します。

使用上の注意

ファイルを操作する場合、以下に注意してください。

  • ファイル入力を使用すると、ArcGIS Online コンテンツのファイルからデータを読み込むことができます。
  • ファイル入力をキャンバスに追加すると、[ファイルの選択] ダイアログ ボックスが開き、次のオプションが表示されます。
    • [既存のファイルを参照] - 以前にアップロードしたアイテムのコンテンツを参照します。 自身のコンテンツ、自身に共有されているコンテンツ、組織および ArcGIS Online で利用できるコンテンツを参照できます。
    • [新しいファイルのアップロード] - ディスクからファイルをアップロードするか、クラウドホスティング オプションのリストから選択します。 詳細については、「アイテムとしてのファイルの追加」をご参照ください。
    Data Pipelines は、コンテンツに直接アップロードできるすべてのファイル タイプをサポートしているわけではありません。 サポートされる形式については、以下のファイル形式の情報をご参照ください。
  • [ファイル形式] パラメーターには、選択したファイルの形式が自動的に設定されます。 サポートされている書式設定オプションには、次のものがあります。
    • [CSV または区切りファイル] - 区切り値を含むファイル (.csv)
    • [シェープファイル] - シェープファイル (.shp) を構成する関連ファイル セットを含む zip 形式のフォルダー
    • [GeoJSON] - オープン規格の地理空間データ交換形式で、単純な地理フィーチャとその非空間属性を表します (.geojson または .json)。
    • [Parquet] - 高度に圧縮された、列指向の表形式による非空間ストレージおよび共有形式 (.parquet)
    • [ファイル ジオデータベース] - 圧縮されたファイル ジオデータベース (.gdb)
  • [CSV または区切りファイル] 形式オプションを指定した場合は、次のデータセット定義パラメーターを使用できます。
    • [区切り文字] - フィールド (または列) およびレコード (または行) の値を分割するために使用される区切り文字。 デフォルトでは、カンマ (,) 区切りが使用されます。 その他の一般的な区切り文字形式には、タブ (\t)、セミコロン (;)、垂直バー (|)、スラッシュおよびバックスラッシュ (/ および \) などがあります。
    • [ヘッダー行を含む] - データセットにヘッダー行が含まれるかどうかを指定します。 デフォルトは true です。 false に設定すると、データセットの最初の行はレコードと見なされます。
    • [複数行データを含む] - データセットに、改行文字を含むレコードが含まれるかどうかを指定します。 デフォルトは false です。 true に設定すると、複数行データを含むデータが正しく読み取られて書式設定されます。
    • [文字エンコーディング] - 指定したデータセットの読み取りに使用されるエンコード タイプを指定します。 デフォルトは [UTF-8] です。 利用可能なエンコード オプションから選択するか、エンコード タイプを指定できます。 値をエンコードする際、スペースはサポートされていません。 たとえば、値に ISO 8859-8 を指定することは無効であり、ISO-8859-8 と指定する必要があります。
  • データ形式の値が [CSV または区切りファイル] の場合は、[フィールド] を使用して、フィールドの名前とタイプを構成できます。 [スキーマの構成] ボタンをクリックするとダイアログ ボックスが開き、データセット フィールドと次のオプションが表示されます。
    • フィールドの挿入または削除 - 該当するフィールドの横にあるチェックボックスをオンにして、そのフィールドを削除できます。 デフォルトでは、すべてのフィールドが挿入されます。
    • [フィールド名] - Data Pipelines で使用するときのフィールドの名前。 この値は編集可能です。 ソース名に無効な文字や予約語が含まれていない限り、デフォルトでは、この値はソース データセット内のフィールドと同じになります。 無効な文字はアンダースコア (_) に置き換えられ、予約語は先頭にアンダースコア (_) が付きます。
    • [フィールド タイプ] - フィールドを Data Pipelines で使用する際のフィールド タイプ。 この値は編集可能です。
    以下の表で、使用できるフィールド タイプについて説明します。

    フィールド タイプ説明

    String

    String フィールドには、テキスト文字の文字列を指定できます。

    Small Integer

    Small Integer フィールドには、-32768 ~ 32767 の整数を指定できます。

    Integer

    Integer フィールドには、-2147483648 ~ 2147483647 の整数を指定できます。

    Big Integer

    Big Integer フィールドには、-9223372036854776000 ~ 9223372036854776000 の整数を指定できます。

    Float

    Float フィールドには、およそ -3.4E38 ~ 3.4E38 の有理数を指定できます。

    Double

    Double フィールドには、およそ -2.2E308 ~ 1.8E308 の有理数を指定できます。

    Date

    Date フィールドには、yyyy-MM-dd HH:mm:ss 形式の値を指定できます。たとえば、有効な値は 2022-12-31 13:30:30 です。 日付の値が別の形式で格納されている場合は、日付/時間の作成ツールを使用して Date フィールドを計算します。

    Boolean

    Boolean フィールドには、TrueFalse を指定できます。 整数表現のブール値 (0 と 1) がフィールドに含まれている場合は、フィールドの更新ツールを使用して、代わりに整数をブール値にキャストします。

  • [GeoJSON] 形式オプションを指定した場合、[ジオメトリ タイプ] パラメーターを使用できます。 このパラメーターはオプションです。 デフォルトでは、GeoJSON ファイル内のジオメトリ タイプが使用されます。 GeoJSON ファイルに複数のジオメトリ タイプが含まれている場合に、このパラメーターの値を指定する必要があります。 ジオメトリ タイプの混在はサポートされておらず、指定したタイプのみが使用されます。 [ポイント][マルチポイント][ポリライン][ポリゴン] のいずれかを指定します。 GeoJSON データの位置を含むジオメトリ フィールドは自動的に計算され、入力データセットに追加されます。 ジオメトリ フィールドを空間演算の入力として使用したり、出力結果でジオメトリを有効化するために使用したりすることができます。
  • [ファイル ジオデータベース] 形式オプションを指定した場合は、[フィーチャクラス名またはテーブル名] パラメーターを使用できます。 このパラメーターを使用して、入力として使用するフィーチャクラスまたはテーブルの名前を指定します。 ポイント、マルチポイント、ポリライン、ポリゴン フィーチャクラスとテーブルのみがサポートされています。 ラスター、モザイク、軌道などのデータセットはサポートされていません。 ジオメトリック ネットワーク フィーチャなどの高度なフィーチャ タイプはサポートされていません。
  • 入力データセットの読み取りパフォーマンスを向上させるには、以下の方法を検討してください。
    • [キャッシュの使用] パラメーターを使用して、データセットのコピーを格納します。 キャッシュされたコピーは、エディターで開いている少なくとも 1 つのブラウザー タブが接続されている間だけ保持されます。 これで、処理中にデータによりすばやくアクセスできるようになる場合があります。 ソース データがキャッシュされた後に更新された場合は、このパラメーターをオフにして、ツールをプレビューするか、再実行してください。
    • 入力データセットを構成した後で、処理されるデータの量を制限する次のツールを構成します。

制限事項

既知の制限事項は以下のとおりです。

  • Data Pipelines では、Excel (.xlsx) ファイルはサポートされていません。
  • テキスト ファイル (.txt)、ORC ファイル (.orc)、JSON ファイル (.json)、GeoParquet ファイル (.geoparquet)、EsriJSON ファイル (.esrijson) のアップロードはサポートされていません。 ArcGIS Online でサポートされているアイテムの詳細については、「ArcGIS Online に追加できるアイテムとは」をご参照ください。
  • 区切り値を含む .txt ファイルが存在する場合は、.csv ファイルとして保存し、その形式でアップロードします。
  • データセットにスペースまたは無効な文字を含むフィールド名が存在する場合、その名前はアンダースコアを使用するように自動的に更新されます。 たとえば、Population 2022 というフィールドは Population_2022 という名前に変更され、%Employed というフィールドは _Employed という名前に変更されます。

ライセンス要件

次のライセンスと構成が必要です。

  • Creator または Professional ユーザー タイプ
  • 公開者、ファシリテーター、管理者ロール、またはそれと同等のカスタム ロール

Data Pipelines の要件の詳細については、要件をご参照ください。

関連トピック

詳細については、「データセットの構成」をご参照ください。