主要内容

このペ,ジの翻訳は最新ではありません。ここをクリックして,英語の最新版を参照してください。

テキストの検出と認識

▪▪▪▪▪▪▪▪▪▪▪▪▪▪▪▪▪▪▪▪▪▪▪▪▪▪

イメージ内のテキストの検出と認識は,コンピュータービジョンアプリケーションで実行される一般的なタスクです。たとえば,走行中の車両から路上シーンのビデオをキャプチャし,キャプチャしたシーンの標識を認識して,ドライバーに標識について知らせることができます。。

テキスト認識の最初のステップは,。テキスト領域を検出するには,局所的なイメージ特徴検出器と記述子,または複雑なイメージシーン内のテキストを検出するように学習させた事前学習済みの深層学習モデルを使用します。ツールボックス内の例では,ブロブ解析,最大限度地稳定极值区域(女士)特徴検出器,および字符区域意识的文本检测(工艺)深層学習モデルを使用してテキストを検出する方法を示しています。

  • ブロブ解析は,テストイメージが2値化されたイメージで,前景にテキスト領域がある場合に効果的です。このメソッドは,領域統計を使用して,。。

  • Mser特徴検出器は,e - mailメ,e - mailジ内のテキスト領域の幾何学的特性が既知である場合に効果的です。また,。特徴検出器は,幾何学的制約を使用して,テキスト以外の領域を除外し,均一な背景や複雑な背景のイメージ内のテキスト領域を検出します。

  • 工艺モデルは,イメージの背景,コントラスト,強度値などの要因に関係なく,イメージ内のテキスト領域を検出するロバストなアプローチです。@ @メ,@ @ジ内のテキスト領域をセグメント化することが難しい場合は,@ @モデルを使用します。このモデルは,他のテキスト検出アプロ,チよりも多くの計算リソ,スを必要とします。

テキスト検出の精度を向上させるための前処理または後処理のステップとして,テキストのセグメンテーションを実行できます。イメージ領域からテキストをセグメント化するには,イメージのしきい値処理やクラスタリングなどのイメージセグメンテーション手法を使用します。matlab . xml . xml . xml . xml®関数の詳細にいては,イメージのセグメンテーションを参照してください。または,色のしきい値アプリとメ,ジの領域分割アプリを使用して,。

次のステップは,機械学習(ML)ベースの分類や光学式文字認識(OCR)法を使用して,検出された領域やセグメント化された領域のテキストを認識することです。関数光学字符识别は,ocrエンジンのペ,ジTesseractオ,プンソ,スOCRエンジンからのOCR言語デタサポトファルを使用します。サポトファイルには、複数の言語で文字を認識するよう事前学習済みの言語データ ファイルが含まれています。追加の言語ファイルは、関数vision万博1manbetxSupportPackagesまたはアドオンエクスプロ,ラ,を使用してダウンロ,ドできます。アドオンのダウンロ,ドの詳細は,アドオンの取得と管理を参照してください。Tesseractオ,プンソ,スOCRエンジンからOCR言語デタサポトファルをンストルして使用する方法にいては,OCR言語デタファルのンストルを参照してください。

アプリ

OCRトレ,ナ, 特定の文字セットを認識するよう光学式文字認識モデルを学習させる

関数

すべて展開する

愿景。BlobAnalysis 連結された領域のプロパティ
detectMSERFeatures Mser特徴を検出してMSERRegionsオブジェクトを返す
detectTextCRAFT 利用CRAFT深度学习模型检测图像中的文本
extractHOGFeatures 勾配方向ヒストグラム(猪)特徴を抽出
光学字符识别 光学式文字認識を使用したテキストの認識
ocrText 存储OCR结果
vision万博1manbetxSupportPackages 计算机视觉工具箱のデータをダウンロード,インストール,またはアンインストールするためのインストーラーの起動

トピック

開始

光学式文字認識の使用