Skip To Content

モデルの概要

進入禁止の標識を識別するモデルのバナー画像

テキスト ラベルは、地籍マップおよびフロア プランに欠かせないパーツです。 テキストは、道路標識、ビルボード、番地、地名など、身の回りの日常的なシーンでも広く使用されています。 このテキストを抽出すると、テキストが説明する場所についての追加のコンテキストと詳細、およびそれによって伝えられる情報を得ることができます。 ドキュメントをデジタル化してそこからテキストを抽出することは、重要な情報の取得と履歴管理に役立ちます。

このディープ ラーニング モデルは、MMOCR モデルに基づいており、OCR (Optical Character Recognition) 技術を使用して画像内のテキストを検出します。 このモデルは、さまざまな背景およびコンテキストを持つさまざまなタイプおよびスタイルのテキストの大規模なデータセットでトレーニングされ、正確なテキスト抽出が可能になりました。 ビルボード、掲示板、スキャンされた地図などからテキストを自動的に検出して読み取り、テキストを含む画像をすぐに使用できるデータに変換するなど、さまざまなタスクに適用できます。

ライセンス要件

このワークフローを完了する場合のライセンス要件は次のとおりです。

  • ArcGIS Desktop - ArcGIS ProArcGIS Image Analyst エクステンション
  • ArcGIS Enterprise - ラスター解析が構成された ArcGIS Image Server
  • ArcGIS OnlineArcGIS Image for ArcGIS Online

モデルの詳細

このモデルには以下の特性があります。

  • 入力 - 中~大サイズのテキストやスキャンされたドキュメントを含む、解像度の高い 3 バンドの道路レベル画像。
  • 出力 - 入力画像で検出されたテキストを四角形で囲んだフィーチャ レイヤー。
  • 計算 - このワークフローは計算負荷が高いため、CUDA 計算能力が 6.0 以上の GPU が推奨されます。
  • アーキテクチャ - このモデルは、MMLab によるオープンソース MMOCR モデルに基づいています。 テキスト検出には PSENet モデルを使用し、テキスト認識には ABINet モデルを使用します。

モデルへのアクセスとダウンロード

Optical Character Recognition 事前トレーニング済みモデルを ArcGIS Living Atlas of the World からダウンロードします。 または、ArcGIS Pro からモデルに直接アクセスするか、ArcGIS Image for ArcGIS Online でモデルを使用します。

ArcGIS Online でのモデルのダウンロード

ArcGIS Online でモデルをダウンロードするには、次の手順に従います。

  1. ArcGIS Living Atlas of the World を参照します。
  2. 自分の ArcGIS Online アカウントの認証情報を使用してサイン インします。
  3. Optical Character Recognition」を検索して、検索結果からアイテム ページを開きます。
  4. [ダウンロード] ボタンをクリックして、モデルをダウンロードします。
    ダウンロードした .dlpk ファイルを ArcGIS Pro で直接使用することも、ArcGIS Enterprise にアップロードして使用することもできます。

ArcGIS Pro でのモデルのダウンロード

ArcGIS Pro でモデルをダウンロードするには、次の手順に従います。

  1. ArcGIS Pro を開きます。
  2. [カタログ] ウィンドウをクリックし、[ポータル] を選択します。
  3. [Living Atlas] をクリックし、「Optical Character Recognition」を検索します。
  4. モデルを右クリックして .dlpk ファイルをダウンロードします。

リリース ノート

以下はリリースノートです。

日付説明

2023 年 7 月

Optical Character Recognition の初回リリース