主要内容

音频贴标签机

(删除)定义和真实可视化标签

自从R2018b

音频贴标签机被移除。使用信号贴标签机代替。有关更多信息,请参见兼容性的考虑

描述

音频贴标签机应用程序使您能够真实的标签数据在该地区级别和文件级别。

使用这个应用程序,您可以:

  • 创建标签定义一致的和快速的标签。

  • 可视化时域波形回放期间。

  • 交互式地指定标签在文件级别和区域层面。您可以指定区域,直接在时域波形上作画。

  • 新音频记录添加到您的数据集。

  • 应用发现演讲区域的自动贴标。

  • 应用自动词标签使用第三方的语音转录服务。看到“语音转录为更多的信息。

应用程序数据作为一个出口labeledSignalSet对象。您可以使用labeledSignalSet训练一个网络、分类器或分析数据和报告统计数据。

打开音频贴标签机应用

  • MATLAB®将来发布:应用程序选项卡,在信号处理和通信,点击应用程序图标。

  • MATLAB命令提示:输入audioLabeler

例子

全部展开

在本例中,您创建一个逻辑面具一个音频信号,对应于话语的“是”和零对应的缺席话语“是”。创建面具,您使用IBM™API通过语音识别音频贴标签机应用程序。

本例要求您安装“语音转录功能。

听音频文件你想标签然后想象它在时域。

[audioIn, fs] = audioread (“KeywordSpeech-16-16-mono-34secs.flac”);声音(audioIn fs) t =(0:元素个数(audioIn) 1) / fs;情节(t, audioIn)包含(“时间(s)”)ylabel (“振幅”)

打开音频贴标签机应用和负载KeywordSpeech-16-16-mono-34secs.flac文件到数据浏览器

自动化,点击语音文字转换。在语音文字转换选项卡上,选择您的首选的语音API。下面的例子使用了IBM语音API。选择段话这文本标签分为单独的词,而不是句子。点击运行与语音识别接口API和创建一个新的感兴趣的区域(ROI)标签。ROI标签包含单词检测和标记由IBM的语音API。

关闭语音文字转换选项卡,然后导出标签信号设置为工作区。

标签是出口到工作区labeledSignalSet对象和一个时间戳。设置变量labeledSet带时间戳的labeledSignalSet对象。

labeledSet = myLabeledSet;

检查SpeechContent标签。

speechContent = labeledSet.Labels.SpeechContent {1}
speechContent =52×2表_______ _____ ROILimits价值1.31 - 1.41 0.87 - 1.31“第一”“你”1.41 - 1.63”说:“1.63 - 2.22 2.25 - 2.52“是”“那么”2.52 - 3.03“不”3.09 - 3.22”和“3.22 - 3.32 3.32 - 3.52“你””说:“3.52 - 3.94 3.94 - 4.16“是”“那么”4.83 - 5.39 4.16 - 4.66“不”“是的”5.42 - 5.57”“6.15 - 6.56 5.57 - 6.07“不”⋮“驾驶”

“语音API返回的极限ROI标签在几秒钟内。使用SpeechContent表来创建一个逻辑向量。

keywordLabels = speechContent (speechContent。值= =“是的”:);keywordROILimitsInSamples =圆(keywordLabels.ROILimits * fs);掩码= 0(大小(audioIn),“逻辑”);i = 1:大小(keywordROILimitsInSamples)面具(keywordROILimitsInSamples(我,1):keywordROILimitsInSamples(我,2))= true;结束

语音信号和关键词发现面具的阴谋。

情节(t, audioInt,面具)包含(“时间(s)”)ylabel (“振幅”)传说(“音频”,“关键词发现面具”,“位置”,“东南”)

编程使用

全部展开

audioLabeler打开应用程序,使您能够真实的标签对音频数据。

版本历史

介绍了R2018b

全部展开