このペ,ジの翻訳は最新ではありません。ここをクリックして,英語の最新版を参照してください。
テキストの検出と認識
イメージ内のテキストの検出と認識は,コンピュータービジョンアプリケーションで実行される一般的なタスクです。たとえば,走行中の車両から路上シーンのビデオをキャプチャし,キャプチャしたシーンの標識を認識して,ドライバーに標識について知らせることができます。。
テキスト認識の最初のステップは,。テキスト領域を検出するには,局所的なイメージ特徴検出器と記述子,または複雑なイメージシーン内のテキストを検出するように学習させた事前学習済みの深層学習モデルを使用します。ツールボックス内の例では,ブロブ解析,最大限度地稳定极值区域(女士)特徴検出器,および字符区域意识的文本检测(工艺)深層学習モデルを使用してテキストを検出する方法を示しています。
ブロブ解析は,テストイメージが2値化されたイメージで,前景にテキスト領域がある場合に効果的です。このメソッドは,領域統計を使用して,。。
Mser特徴検出器は,e - mailメ,e - mailジ内のテキスト領域の幾何学的特性が既知である場合に効果的です。また,。特徴検出器は,幾何学的制約を使用して,テキスト以外の領域を除外し,均一な背景や複雑な背景のイメージ内のテキスト領域を検出します。
工艺モデルは,イメージの背景,コントラスト,強度値などの要因に関係なく,イメージ内のテキスト領域を検出するロバストなアプローチです。@ @メ,@ @ジ内のテキスト領域をセグメント化することが難しい場合は,@ @モデルを使用します。このモデルは,他のテキスト検出アプロ,チよりも多くの計算リソ,スを必要とします。
テキスト検出の精度を向上させるための前処理または後処理のステップとして,テキストのセグメンテーションを実行できます。イメージ領域からテキストをセグメント化するには,イメージのしきい値処理やクラスタリングなどのイメージセグメンテーション手法を使用します。matlab . xml . xml . xml . xml®関数の詳細にいては,イメージのセグメンテーションを参照してください。または,色のしきい値アプリとメ,ジの領域分割アプリを使用して,。
次のステップは,機械学習(ML)ベースの分類や光学式文字認識(OCR)法を使用して,検出された領域やセグメント化された領域のテキストを認識することです。関数光学字符识别
は,ocrエンジンのペ,ジTesseractオ,プンソ,スOCRエンジンからのOCR言語デタサポトファルを使用します。サポトファイルには、複数の言語で文字を認識するよう事前学習済みの言語データ ファイルが含まれています。追加の言語ファイルは、関数vision万博1manbetxSupportPackages
またはアドオンエクスプロ,ラ,を使用してダウンロ,ドできます。アドオンのダウンロ,ドの詳細は,アドオンの取得と管理を参照してください。Tesseractオ,プンソ,スOCRエンジンからOCR言語デタサポトファルをンストルして使用する方法にいては,OCR言語デタファルのンストルを参照してください。
アプリ
OCRトレ,ナ, | 特定の文字セットを認識するよう光学式文字認識モデルを学習させる |
関数
トピック
開始
- 局所特徴の検出と抽出
局所特徴の検出と抽出の利点と用途の学習。 - 特徴点のタ@ @プ
いくかの種類の特徴の点オブジェクトを返したり受け入れたりする関数の選択。
光学式文字認識の使用
- カスタムフォントにいての光学式文字認識の学習
OCRアプリを使用して,カスタム言語またはカスタムフォントを認識するよう関数光学字符识别
に学習させます。 - OCR言語デタファルのンストル
光学式文字認識(ocr)言語のファルをサポトしています。 - 関数OCRの結果のトラブルシュ,ティング
光学式文字認識(OCR)関数OCRのトラブルシュ,ティング