帮助中心帮助中心

文本检测和识别

检测和识别文本使用图像特征检测和描述,深度学习和OCR

检测和识别文本图像是一项常见的任务在计算机视觉的应用程序执行。例如,您可以捕获视频的道路场景移动车辆,在捕获的场景识别标志,提醒司机的迹象。

您可以组合检测和识别组合成一个两步的过程,发现区域包含文本的第一步,然后是第二步识别区域内的文本。

输入图像显示一个可停车信号,连接到一个探测器,与预测输出图像边界签署文本框覆盖,连接到一个识别器,输出标志上的单词认识的列表。

文本检测算法使用本地图像功能,机器学习或深度学习,来定位或部分文本在一个图像。计算机视觉工具箱™中的示例演示如何使用blob分析,最大限度地稳定极值区域特征检测器(女士),和文本的字符区域意识检测(工艺)深学习模型的文本检测。

一旦检测到文本,文字识别模型,基于机器学习或深度学习、过程预测地区返回的文本文本。的光学字符识别函数使用pretrained语言模型来识别文本以多种语言。你也可以训练一个定制的语言模型使用trainOCR函数。有关更多信息,请参见开始使用OCR。

应用程序

图片标志	计算机视觉应用程序标签图片

功能

标签

图片标志 计算机视觉应用程序标签图片

培训和评估

`trainOCR`	火车OCR识别文本图像模型
`evaluateOCR`	评估OCR的结果与地面真理
`ocrMetrics`	商店OCR质量指标
`ocrTrainingOptions`	选择培训OCR模型
`ocrTrainingData`	创造训练数据OCR从地面真理

量化

quantizeOCR 数字转换OCR模型

文本检测

`detectTextCRAFT`	检测图像中的文本通过工艺深度学习模型
`detectMSERFeatures`	检测女士特性
`vision.BlobAnalysis`	连接区域的属性
`extractHOGFeatures`	提取的梯度的柱状图(猪)特性

文字识别

`光学字符识别`	识别文本使用光学字符识别
`ocrText`	存储OCR结果
`vision万博1manbetxSupportPackages`	开始安装程序下载、安装或卸载计算机视觉的工具箱数据

主题

开始

开始使用OCR
检测和识别文本以多种语言,火车OCR识别模型自定义文本。
火车定制OCR模型
火车一个光学字符识别(OCR)模型识别自定义文本。
安装OCR语言数据文件
万博1manbetx光学字符识别(OCR)语言的支持文件。
当地的特征检测和提取
学习的好处和应用局部特征检测和提取。
点特征类型
选择函数返回对象和接受点几个类型的特性。

特色的例子

识别文本使用光学字符识别(OCR)

识别文本使用光学字符识别(OCR)

识别文本图像使用光学字符识别。

打开生活的脚本

使用OCR识别七段数字

使用OCR识别七段数字

使用OCR识别文本检测工艺和地区的七段数字属性。

打开生活的脚本

自动检测并使用女士和OCR识别文本

自动检测并使用女士和OCR识别文本

自动检测并使用女士和OCR识别文本图像。

打开生活的脚本

自动检测并使用Pretrained工艺网络和OCR识别文本

自动检测并使用Pretrained工艺网络和OCR识别文本

执行文本识别通过使用一个基于深度学习文本探测器和光学字符识别。在这个示例中,您使用一个pretrained工艺(文本)字符区域意识深入学习网络检测输入图像中的文本区域。您可以修改区域阈值和工艺的亲和力阈值模型本土化整个段落,句子或词。然后,您使用OCR识别发现文本中的字符区域。

打开生活的脚本

自动化地面实况OCR的标签

自动化地面实况OCR的标签

自动化的文本标签OCR培训和评估。

打开生活的脚本

火车一个OCR模型识别的七段数字

火车一个OCR模型识别的七段数字

火车一个OCR模型,可以识别的七段数字。

打开生活的脚本

数字分类使用猪特性

数字分类使用猪特性

数字使用猪的特性和多类支持向量机分类器进行分类。

打开生活的脚本