计算机视觉的工具箱
设计和测试计算机视觉、3D视觉和视频处理系统
计算机视觉工具箱™ 提供用于设计和测试计算机视觉、3D视觉和视频处理系统的算法、功能和应用程序。可以执行对象检测和跟踪,以及特征检测、提取和匹配。您可以自动执行单摄像机、立体摄像机和鱼眼摄像机的校准工作流。对于三维视觉,工具箱支持视觉和点云SLAM、立体视觉、运动结构和点云处理。计算机视觉应用程序自动化地面真相标记和摄像机校准工作流。万博1manbetx
您可以使用深度学习和机器学习算法(如YOLO v2、SSD和ACF)来训练自定义对象检测器。对于语义和实例分割,可以使用深度学习算法,如U-Net和Mask R-CNN。工具箱提供了对象检测和分割算法,用于分析太大而无法放入内存的图像。通过预训练模型,可以检测人脸、行人和其他常见对象。
您可以通过在多核处理器和GPU上运行它们来加速您的算法。工具箱算法支持C / C ++代码生成万博1manbetx,用于与现有代码,桌面原型设计和嵌入式视觉系统部署集成。
开始:
了解其他人如何使用计算机视觉工具箱
目标检测与识别
培训,评估和部署对象探测器,如yolo v2,更快的R-CNN,ACF和Viola-Jones。用一袋视觉单词和OCR执行对象识别。使用佩带的模型来检测面部,行人和其他常见物体。
语义细分
通过使用SegNet、FCN、U-Net和DeepLab v3+等网络对单个像素和体素进行分类,分割图像和3D体积。使用实例分割来生成分割地图和检测对象的唯一实例。
地面真值标注
使用视频标签机和图像标签机应用程序自动标记对象检测、语义分割、实例分割和场景分类。
立体相机标定
校准立体声对以计算深度并重建3D场景。
特征检测、提取和匹配
在多个图像上检测、提取和匹配有趣的特征,如斑点、边缘和角。
基于特征的图像配准
跨多个图像匹配特征,以估计图像之间的几何变换并注册图像序列。
代码生成
为工具箱函数,类,系统对象和块生成C / C ++代码,CUDA代码和MEX函数。