主要内容

文本检测和识别

检测和识别文本使用图像特征检测和描述,深度学习和OCR

检测和识别文本图像是一项常见的任务在计算机视觉的应用程序执行。例如,您可以捕获视频的道路场景移动车辆,在捕获的场景识别标志,提醒司机的迹象。

您可以组合检测和识别组合成一个两步的过程,发现区域包含文本的第一步,然后是第二步识别区域内的文本。

输入图像显示一个可停车信号,连接到一个探测器,与预测输出图像边界签署文本框覆盖,连接到一个识别器,输出标志上的单词认识的列表。

文本检测算法使用本地图像功能,机器学习或深度学习,来定位或部分文本在一个图像。计算机视觉工具箱™中的示例演示如何使用blob分析,最大限度地稳定极值区域特征检测器(女士),和文本的字符区域意识检测(工艺)深学习模型的文本检测。

一旦检测到文本,文字识别模型,基于机器学习或深度学习、过程预测地区返回的文本文本。的光学字符识别函数使用pretrained语言模型来识别文本以多种语言。你也可以训练一个定制的语言模型使用trainOCR函数。有关更多信息,请参见开始使用OCR

应用程序

图片标志 计算机视觉应用程序标签图片

功能

全部展开

图片标志 计算机视觉应用程序标签图片
trainOCR 火车OCR识别文本图像模型
evaluateOCR 评估OCR的结果与地面真理
ocrMetrics 商店OCR质量指标
ocrTrainingOptions 选择培训OCR模型
ocrTrainingData 创造训练数据OCR从地面真理
quantizeOCR 数字转换OCR模型
detectTextCRAFT 检测图像中的文本通过工艺深度学习模型
detectMSERFeatures 检测女士特性
vision.BlobAnalysis 连接区域的属性
extractHOGFeatures 提取的梯度的柱状图(猪)特性
光学字符识别 识别文本使用光学字符识别
ocrText 存储OCR结果
vision万博1manbetxSupportPackages 开始安装程序下载、安装或卸载计算机视觉的工具箱数据

主题

开始