文本检测与识别
使用图像特征检测和描述、深度学习和OCR检测和识别文本
检测和识别图像中的文本是计算机视觉应用中一个常见的任务。例如,您可以从移动的车辆上捕获道路场景的视频,识别捕获场景中的路标,并提醒驾驶员注意这些标志。
您可以将检测和识别合并为两步过程,其中第一步查找包含文本的区域,然后第二步识别区域内的文本。
文本检测算法使用局部图像特征、机器学习或深度学习来定位或分割图像中的文本。计算机视觉工具箱™中的示例演示了如何使用blob分析、最大稳定极值区域(MSER)特征检测器和用于文本检测的字符区域感知(CRAFT)深度学习模型进行文本检测。
一旦检测到文本,基于机器学习或深度学习的文本识别模型将处理文本区域以返回预测的文本。的光学字符识别
函数使用预先训练的语言模型来识别多种语言的文本。类训练自定义语言模型trainOCR
函数。有关更多信息,请参见OCR入门.
应用程序
图片标志 | 用于计算机视觉应用的标签图像 |
功能
主题
开始
- OCR入门
检测和识别多种语言的文本,训练OCR模型识别自定义文本。 - 训练自定义OCR模型
训练光学字符识别(OCR)模型来识别自定义文本。 - 安装OCR语言数据文件
万博1manbetx支持光学字符识别(OCR)语言的文件。 - 局部特征检测与提取
学习局部特征检测和提取的优点和应用。 - 点特征类型
为几种类型的特征选择返回和接受点对象的函数。