Skip To Content

モデルの概要

モデルのバナー画像

テキストは、道路標識、ビルボード、番地、地名など、身の回りの日常的なシーンで広く使用されています。 また、テキスト ラベルは、地籍マップおよびフロア プランに欠かせないパーツでもあります。 このテキストを抽出すると、テキストが説明する場所についての追加のコンテキストと詳細、およびそれによって伝えられる情報を得ることができます。

このディープ ラーニング モデルは、PaddleOCR モデルに基づいており、OCR (Optical Character Recognition) 技術を使用して画像内のテキストを検出します。 このモデルは、さまざまな背景およびコンテキストを持つさまざまなタイプおよびスタイルのテキストの大規模なデータセットでトレーニングされ、正確なテキスト抽出が可能になりました。 ビルボード、掲示板、スキャンされた地図などからテキストを自動的に検出して読み取り、テキストを含む画像をすぐに使用できるデータに変換するなど、さまざまなタスクに適用できます。

ライセンス要件

このワークフローを完了する場合のライセンス要件は次のとおりです。

  • ArcGIS Desktop - ArcGIS ProArcGIS Image Analyst エクステンション
  • ArcGIS Enterprise - ラスター解析が構成された ArcGIS Image Server
  • ArcGIS OnlineArcGIS Image for ArcGIS Online

モデルの詳細

このモデルには以下の特性があります。

  • 入力 - 中~大サイズのテキストを含む、解像度の高い 3 バンドの道路レベル画像や方向付き画像。
  • 出力 - 入力画像で検出されたテキストを四角形で囲んだフィーチャ レイヤー。
  • 計算 - このモデルは CPU でのみ実行されます。
  • アーキテクチャー - シーン テキストの解析モデルは、「PP-OCR: A Practical Ultra Lightweight OCR System」というタイトルの論文に基づく事前トレーニング済みテキスト認識 PaddleOCR のラッパーです。 モデル アーキテクチャーと、モデルで使用されるトレーニング データの詳細については、論文をご参照ください。

モデルへのアクセスとダウンロード

シーン テキストの解析 事前トレーニング済みモデルを ArcGIS Living Atlas of the World からダウンロードします。 または、ArcGIS Pro からモデルに直接アクセスするか、ArcGIS Image for ArcGIS Online でモデルを使用します。

  1. ArcGIS Living Atlas of the World を参照します。
  2. 自分の ArcGIS Online アカウントの認証情報を使用してサイン インします。
  3. シーン テキストの解析」を検索して、検索結果からアイテム ページを開きます。
  4. [ダウンロード] ボタンをクリックして、モデルをダウンロードします。
    ダウンロードした .dlpk ファイルを ArcGIS Pro で直接使用することも、ArcGIS Enterprise にアップロードして使用することもできます。

リリース ノート

以下はリリースノートです。

日付説明

2022 年 3 月

  • シーン テキストの解析の初回リリース