ビッグ データ解析で使用できます。
[類似フィーチャの検索] ツール は、フィーチャ属性に基づいて、1 つ以上の入力フィーチャに最も類似している、または最も類似していない候補フィーチャを識別します。
ワークフロー図
例
以下は、類似フィーチャの検索ツールの使用例です。
- 数値属性の値の相互関係に基づいて、製造施設のうちどれが、最も生産性が高い施設と最も類似しているかを判定します。
- 犯罪分析者は、すべての犯罪のデータベースを検索して、最近の犯罪がより大きなパターンまたは傾向に含まれているかどうかを判定することができます。
- 疫病の被害を最も大きく受けた村の特徴に基づいて、疫病のリスクの高い他の村を判定します。
使用上の注意
類似フィーチャの検索ツールを操作する際には、以下の点に注意してください。
- テーブル、ポイント、ポリライン、またはポリゴン フィーチャを使用できます。
- 検索 (候補) フィーチャが必要で、参照フィーチャとの類似性または相違に基づいてランク付けされます。
- 最大 10,000 の検索レイヤー フィーチャが返されます。
- [ターゲット レイヤー (参照場所フィーチャ)] パラメーター値に複数のフィーチャが存在する場合、参照フィーチャの値の平均に基づいて一致が行われます。 たとえば、2 つの参照フィーチャがあり、解析フィールドの属性の 1 つが人口変数なら、平均人口値に最も近い人口値を持つ [レイヤーの結合 (候補検索フィーチャ)] パラメーター値が検索されます。 たとえば、人口値が 100 と 102 なら、人口が 101 に近い候補が検索されます。
注意:
[ターゲット レイヤー (参照場所フィーチャ)] パラメーターに複数のフィーチャが存在する場合、類似の値を持つ属性に [類似性の基準] (解析フィールド) を選択します。 たとえば、1 つのフィーチャの人口値が 100、もう 1 つの人口値が 100,000 なら、2 つの平均値である 50,050 に近い人口値で一致が行われます。 この平均値は、いずれのレイヤーの人口値とも大きく異なります。
- [類似度] パラメーターを使用し、[最も類似する] または [最も類似しない] オプションを使用して、参照フィーチャに最も類似する、または最も類似しないフィーチャを検索します。 場合によっては、両方を確認します。 たとえば、[類似度] パラメーターに「3」、[類似度] パラメーターに [最も類似する、および最も類似しない] を設定すると、最も類似する 3 つと、最も類似しない 3 つの候補フィーチャが検索されます。
- 出力における一致結果は、参照フィーチャに最も類似する結果か、最も類似しない結果のいずれかです。1 つの結果が両方を兼ねることはできません (また、出力フィーチャ内で一致結果が重複することもありません)。 したがって、[類似度] パラメーターに [最も類似する、および最も類似しない] を選択すると、可能な一致結果の最大数 (結果の数) は、結合レイヤーの半分です。
- [照合方法] には次の 2 つのオプションがあります。
- [属性値] ― すべての分析フィールド属性の差の二乗和が最も小さいものが最も類似した候補になります。 差を計算する前に、すべての値が標準化されます。
- [属性プロファイル] - コサイン類似度が測定されます。 コサイン類似度では、大きさを照合するのではなく、標準化された属性値の間で同じ関係を探します。 たとえば、A1、A2、A3 という 3 つの分析フィールドがあるとします。 A2 は A1 の 2 倍であり、A3 は A2 とほぼ同じです。 [照合方法] パラメーターが [属性プロファイル] に設定されている場合、ツールは、A2 が A1 の 2 倍で、A3 が A2 とほぼ同じ属性関係を含む候補を検索します。 この方法は属性間の関係に注目するため、2 つ以上の分析フィールド属性を指定する必要があります。 たとえば、20 歳未満の住民の数に対する車の数と比較した人口のプロファイルを基に、コサイン類似度方式 ([属性プロファイル] オプション) を使用して、ロサンゼルスと類似する場所を、異なる縮尺で見つけることができます。 コサイン類似度指標の範囲は、1.0 (完全に類似) から -1.0 (完全に相違) までです。 コサイン類似度指標は、出力フィーチャの simindex フィールドに書き込まれます。
- [類似性の基準] パラメーターは数値で、参照場所フィーチャ (ターゲット レイヤー) と候補検索 (結合レイヤー) データセットの両方に同じフィールド名とフィールド タイプで存在する必要があります。 候補検索 (結合レイヤー) フィーチャに対応するフィールドが見つからない場合、同一のフィールド名が存在する必要があることを示す検証警告が表示されます。
- 照合に使用されたすべての属性が、出力に書き込まれます。 [追加フィールド] パラメーターを使用して、出力テーブルに追加するフィールドを指定します。 デフォルトでは、すべてのフィールドが追加されます。 [追加フィールド] パラメーターを使用して、結合レイヤーから追加するフィールドを選択します。
パラメーター
以下は、類似フィーチャの検索ツールのパラメーターです。
パラメーター | 説明 | データ タイプ |
---|---|---|
ターゲット レイヤー (参照場所フィーチャ) | 参照フィーチャを含むターゲット レイヤー。 参照フィーチャは、[参照場所の式] または [参照場所の範囲] パラメーター (下) を使用してさらに減らす、またはフィルターを適用できます。 | フィーチャ |
結合レイヤー (候補検索フィーチャ) | 結合レイヤーには検索または候補フィーチャが含まれます。 ツールは検索フィーチャを評価して、[ターゲット レイヤー] (参照フィーチャ) パラメーターに類似する分析フィールド属性値を持つフィーチャを見つけます。 | フィーチャ |
参照場所の式 | Arcade 属性条件式で、その評価結果を使用して、保持するターゲット レイヤー (参照フィーチャ) にフィルターが適用されます。 式は、[Arcade 条件式の構成] をクリックしてアクセスする Arcade 条件式ビルダーで構成します。 各レコードが評価され、True と評価されたレコードが維持され、False と評価されたレコードが破棄されます。 | 文字列 (Arcade 条件式) |
参照場所の範囲 | 必要に応じて、参照場所をフィルター処理する範囲を指定します。 このパラメーターで指定された参照空間範囲内にある参照フィーチャのみが、参照フィーチャとして維持されます。 ツールの構成には、参照場所の範囲を描画できる範囲セレクター コンポーネントがあります。 | EsriJSON エンベロープ |
類似性の基準 | 対象となる 1 つ以上の数値属性 (分析フィールド) を指定します。 これらの属性フィールドの値は、[ターゲット レイヤー (参照場所フィーチャ)] パラメーター値について計算されます。 その後、[結合レイヤー (候補検索フィーチャ)] パラメーターのフィーチャが評価され、どの検索フィーチャが参照フィーチャと最も類似している/いないかが判定されます。 | 文字列 (フィールド名) |
相似 | このツールから返される結果が、指定された分析フィールドに対して [ターゲット レイヤー (参照場所フィーチャ)] パラメーター値と最も類似しているものか、最も類似していないものかを決定します。 返される結果の最大数は 10,000 です。 返すフィーチャについて、[最も類似する]、[最も類似しない]、または [最も類似する、および最も類似しない] オプションを選択できます。 | 整数および文字列 |
照合方法 | 照合方法には次の 2 つがあります。
| String |
追加フィールド | 照合に使用されたすべての属性が、出力に書き込まれます。 [追加フィールド] パラメーターを使用すると、特定のフィールドのみを指定して出力テーブルに追加できます。 デフォルトでは、すべてのフィールドが追加されます。 [追加フィールド] パラメーターを使用して、[結合レイヤー (候補検索フィーチャ)] パラメーター値から追加するフィールドを選択します。 | 文字列 (フィールド名) |
参照 ID フィールド (オプション) | [ターゲット レイヤー (参照場所フィーチャ)] スキーマ内で固有の ID が含まれるフィールド。 フィールドが選択されてない場合、フィーチャ用の固有の ID がツールにより生成されます。 | 文字列 (フィールド名) |
候補 ID フィールド (オプション) | [結合レイヤー (候補検索フィーチャ)] スキーマ内で固有の ID が含まれるフィールド。 フィールドが選択されてない場合、フィーチャ用の固有の ID がツールにより生成されます。 | 文字列 (フィールド名) |
出力レイヤー
[ターゲット レイヤー (参照場所フィーチャ)] パラメーター内のすべてのフィーチャと、[結合レイヤー (候補検索フィーチャ)] パラメーター内のすべての一致が、[類似性の基準] および [追加フィールド] パラメーターからの属性とともに、出力フィーチャに書き込まれます。 さらに、次のフィールドが出力フィーチャに含められます。
フィールド名 | 説明 | 備考 |
---|---|---|
location_type | フィーチャがターゲット参照フィーチャか、結合検索 (候補) フィーチャかを示す文字列。 | |
simrank | [類似性] パラメーターに [最も類似する] または [最も類似する、および最も類似しない] を選択すると、すべての一致結果が、最も類似するものから最も類似しないものへの順にランク付けされます。 最も類似する一致結果は、ランク値が 1 になります。 | [類似性] パラメーターに [最も類似しない] または [最も類似する、および最も類似しない] を選択した場合のみ、このフィールドが出力フィーチャに含められます。 |
dissimrank | [類似性] パラメーターに [最も類似しない] または [最も類似する、および最も類似しない] を選択すると、すべての一致結果が、最も類似するものから最も類似しないものへの順にランク付けされます。 最も類似しない一致結果は、ランク値が 1 になります。 | [類似性] パラメーターに [最も類似しない] または [最も類似する、および最も類似しない] を選択した場合のみ、このフィールドが出力フィーチャに含められます。 |
simindex | このフィールドは、それぞれの一致結果がターゲット参照フィーチャにどれだけ類似しているかを定量化します。 [照合方法] パラメーターの値に [属性値] を指定した場合、この値は二乗差の合計になります。 | [照合方法] パラメーターに [属性値] を選択した場合にのみ、このフィールドは出力フィーチャに含められます。 |
cosimindex | このフィールドは、それぞれの一致結果がターゲット フィーチャにどれだけ類似しているかを定量化します。 [照合方法] パラメーターに [属性プロファイル] を指定した場合、この値はコサイン類似度を表します。 | [照合方法] パラメーターに [属性プロファイル] を選択した場合にのみ、このフィールドは出力フィーチャに含められます。 |
labelrank | このフィールドは、表示のためにのみ使用されます。 このツールは、このフィールドを使用して解析結果のデフォルトのレンダリングを提供します。 | |
reference_id | ターゲット参照フィーチャの固有の ID 値。 結合検索 (候補) フィーチャには NULL 値が指定されます。 [参照 ID フィールド] パラメーターが指定されていない場合、参照フィーチャ用に固有の ID 値が生成されます。 | |
search_id | 結合検索 (候補) フィーチャの固有の ID 値。 ターゲット参照フィーチャには NULL 値が指定されます。 [候補 ID フィールド] パラメーターが指定されていない場合、候補検索フィーチャ用に固有の ID 値が生成されます。 |