主要内容

音频贴标机

定义并可视化地面真相标签

描述

这个音频贴标机应用程序使您能够在地区级别和文件级别标记地面真实数据。

使用该应用程序,您可以:

  • 为一致和快速的标签创建标签定义。

  • 在回放期间可视化时域波形。

  • 在文件级别和区域级别以交互方式指定标签。可以通过直接在时域波形上绘制来指定区域。

  • 录制要添加到数据集的新音频。

  • 对检测到的语音区域应用自动标记。

  • 将使用第三方语音的自动单词标签应用于文本转录服务。请参阅语音文本转换了解更多信息。

该应用程序将数据导出为标记信号集对象。您可以使用标记信号集训练网络、分类器或分析数据和报告统计数据。

打开音频标签应用程序

  • MATLAB®工具条:在应用程序选项卡,在下面信号处理和通信,单击应用程序图标。

  • MATLAB命令提示符:输入音频标签机.

例子

全部展开

在本例中,您为音频信号创建了一个逻辑掩码,其中1对应于“yes”语句,0对应于没有“yes”语句™ 通过音频贴标机应用程序。

此示例要求您安装语音文本转换功能。

收听要标记的音频文件,然后在时域中将其可视化。

[audioIn, fs] = audioread (“关键字Speech-16-16-mono-34秒flac”);声音(audioIn,fs)t=(0:numel(audioIn)-1)/fs;绘图(t,audioIn)xlabel(“时间(s)”) ylabel (“振幅”)

打开音频贴标机应用程序并加载关键词speech-16-16-mono-34secs.flac归档到数据浏览器.

在下面自动化点击从语音到文本.在从语音到文本选项卡上,选择首选的语音到文本API。此示例使用IBM语音到文本API。选择段话这样,文本标签将被划分为单个单词而不是句子。单击以与语音到文本的API进行接口,并创建一个新的感兴趣区域(ROI)标签。ROI标签包含由IBM的语音到文本API检测和标记的单词。

关闭从语音到文本选项卡,然后将标记的信号集导出到工作空间。

标签将按以下方式导出到工作空间:标记信号集具有时间戳的对象。设置变量标签集到时间戳标记信号集对象。

labeledSet = myLabeledSet;

检查演讲内容标签

speechContent=labeledSet.Labels.speechContent{1}
演讲内容=52×2表ROILimits价值  ____________ _________ 1.31 - 1.41 0.87 - 1.31“第一”“你”1.41 - 1.63”说:“1.63 - 2.22 2.25 - 2.52“是”“那么”2.52 - 3.03“不”3.09 - 3.22”和“3.22 - 3.32 3.32 - 3.52“你””说:“3.52 - 3.94 3.94 - 4.16“是”“那么”4.16 - 4.66 4.83 - 5.39“不”“是的”5.42 - 5.57”,“5.57 - 6.07 6.15 - 6.56“不”⋮“驾驶”

语音到文本API以秒为单位返回ROI标签的限制演讲内容表来创建逻辑向量。

关键字标签=speechContent(speechContent.Value==“是的”,:); 关键字RoiLimitsInSamples=round(关键字Labels.ROILimits*fs);掩码=零(尺寸(音频输入),“逻辑的”);对于i = 1:size(keywordROILimitsInSamples) mask(keywordROILimitsInSamples(i,1):keywordROILimitsInSamples(i,2)) = true;终止

绘制语音信号和关键词识别掩码。

情节(t,audioIn,...t,面具)包含(“时间(s)”) ylabel (“振幅”)传奇(“音频”,“关键词识别面具”,“位置”,“东南”)

相关实例

程序化使用

全部展开

音频标签机打开应用程序,使您能够标记有关音频的地面实况数据。

在R2018b中引入