音频贴标机

定义和可视化地面实况标签

描述

音频贴标机应用程序使您能够同时在区域级和文件级标记地面实况数据。

使用的应用程序,您可以:

  • 创建一致,快速标签标签定义。

  • 在播放过程中显现时域波形。

  • 交互指定在文件级和区域级的标签。您可以直接在时域波形绘制指定的区域。

  • 录制新的音频添加到您的数据集。

  • 应用检测到语音区的自动贴标签。

  • 应用自动字使用第三方语音到文本的转录服务标记。看到语音到文本转了解更多信息。

该应用程序的出口数据作为labeledSignalSet宾语。您可以使用labeledSignalSet训练网络,分类,或进行数据分析和报表统计。

打开音响贴标应用

  • MATLAB®工具条:在应用选项卡,在信号处理和通信,点击应用程序图标。

  • MATLAB命令提示符:输入audioLabeler

例子

展开全部

在此例中,创建对于其中那些对应于发声的“是”和零对应于不存在发声“是”的音频信号的逻辑掩模。要创建面膜,则通过使用IBM™语音到文本API音频贴标机应用程序。

此示例要求安装语音到文本转功能。

听音频文件要标签,然后想象它在时域。

[AUDIOIN,FS] = audioread(“KeywordSpeech-16-16-单34secs.flac”);声音(AUDIOIN,FS)T =(0:numel(AUDIOIN)-1)/ FS;情节(T,AUDIOIN)xlabel('时间(s)')ylabel('振幅'

打开音频贴标机应用和负载KeywordSpeech-16-16-单34secs.flac文件进数据浏览器

自动化,点击语音到文本。在语音到文本选项卡,选择您喜欢的语音到文本的API。这个例子使用了IBM的语音至文本API。选择段词从而使文本标签分为单独的单词,而不是句子。请点击与语音到文本的API接口和创造利益(ROI)标签的新区域。投资回报率标签包含检测和IBM的语音到文本标记API的话。

关上语音到文本标签,然后将标记信号组导出到工作空间。

标签出口到该工作区,labeledSignalSet带有时间戳对象。设置变量labeledSet到时间戳labeledSignalSet宾语。

labeledSet = myLabeledSet;

检查SpeechContent标签。

speechContent = labeledSet.Labels.SpeechContent {1}
speechContent =52×2表ROILimits价值____________ _________ 0.87 1.31 “第一” 1.31 1.41 “您” 1.41 1.63 “之称的” 1.63 2.22 “是” 2.25 2.52 “然后” 2.52 3.03 “无” 3.09 3.22 “和” 3.22 3.32 “您” 3.32 3.52 “之称的” 3.523.94 “是” 3.94 4.16 “然后” 4.16 4.66 “否” 4.83 5.39 “是” 5.42 5.57 “的” 5.57 6.07 “否” 6.15 6.56 “驾驶” ⋮

语音到文本的API返回的ROI的标签,以秒为限。使用SpeechContent表创建逻辑矢量。

keywordLabels = speechContent(speechContent.Value ==“是”,:);keywordROILimitsInSamples = ROUND(keywordLabels.ROILimits * FS);掩模=零(大小(AUDIOIN),“逻辑”);对于I = 1:尺寸(keywordROILimitsInSamples)掩模(keywordROILimitsInSamples(I,1):keywordROILimitsInSamples(I,2))= TRUE;结束

画出语音信号和关键词识别面具。

图(T,AUDIOIN,...吨,掩模)xlabel('时间(s)')ylabel('振幅')图例(“音频”“关键词识别面具”'位置''东南'

相关的例子

程序中使用

展开全部

audioLabeler打开应用程序,使您能够对音频标签地面实况数据。

介绍了在R2018b