音频贴标签机
描述
的音频贴标签机应用程序使您能够真实的标签数据在该地区级别和文件级别。
使用这个应用程序,您可以:
创建标签定义一致的和快速的标签。
可视化时域波形回放期间。
交互式地指定标签在文件级别和区域层面。您可以指定区域,直接在时域波形上作画。
新音频记录添加到您的数据集。
应用发现演讲区域的自动贴标。
应用自动词标签使用第三方的语音转录服务。看到“语音转录为更多的信息。
应用程序数据作为一个出口labeledSignalSet
对象。您可以使用labeledSignalSet
训练一个网络、分类器或分析数据和报告统计数据。
更多的
高级sublabeling和自定义自动标记功能,请参阅贴标签机导入和播放音频文件中的数据信号。
不支持音频播放和录制万博1manbetxMATLAB在线。
打开音频贴标签机应用
MATLAB®将来发布:应用程序选项卡,在信号处理和通信,点击应用程序图标。
MATLAB命令提示:输入
audioLabeler
。
例子
使用音频贴标签机创建关键字发现面具
在本例中,您创建一个逻辑面具一个音频信号,对应于话语的“是”和零对应的缺席话语“是”。创建面具,您使用IBM™API通过语音识别音频贴标签机应用程序。
本例要求您安装“语音转录功能。
听音频文件你想标签然后想象它在时域。
[audioIn, fs] = audioread (“KeywordSpeech-16-16-mono-34secs.flac”);声音(audioIn fs) t =(0:元素个数(audioIn) 1) / fs;情节(t, audioIn)包含(“时间(s)”)ylabel (“振幅”)
打开音频贴标签机应用和负载KeywordSpeech-16-16-mono-34secs.flac
文件到数据浏览器。
下自动化,点击语音文字转换。在语音文字转换选项卡上,选择您的首选的语音API。下面的例子使用了IBM语音API。选择段话这文本标签分为单独的词,而不是句子。点击运行与语音识别接口API和创建一个新的感兴趣的区域(ROI)标签。ROI标签包含单词检测和标记由IBM的语音API。
关闭语音文字转换选项卡,然后导出标签信号设置为工作区。
标签是出口到工作区labeledSignalSet
对象和一个时间戳。设置变量labeledSet
带时间戳的labeledSignalSet
对象。
labeledSet = myLabeledSet;
检查SpeechContent
标签。
speechContent = labeledSet.Labels.SpeechContent {1}
speechContent =52×2表_______ _____ ROILimits价值1.31 - 1.41 0.87 - 1.31“第一”“你”1.41 - 1.63”说:“1.63 - 2.22 2.25 - 2.52“是”“那么”2.52 - 3.03“不”3.09 - 3.22”和“3.22 - 3.32 3.32 - 3.52“你””说:“3.52 - 3.94 3.94 - 4.16“是”“那么”4.83 - 5.39 4.16 - 4.66“不”“是的”5.42 - 5.57”“6.15 - 6.56 5.57 - 6.07“不”⋮“驾驶”
“语音API返回的极限ROI标签在几秒钟内。使用SpeechContent
表来创建一个逻辑向量。
keywordLabels = speechContent (speechContent。值= =“是的”:);keywordROILimitsInSamples =圆(keywordLabels.ROILimits * fs);掩码= 0(大小(audioIn),“逻辑”);为i = 1:大小(keywordROILimitsInSamples)面具(keywordROILimitsInSamples(我,1):keywordROILimitsInSamples(我,2))= true;结束
语音信号和关键词发现面具的阴谋。
情节(t, audioIn…t,面具)包含(“时间(s)”)ylabel (“振幅”)传说(“音频”,“关键词发现面具”,“位置”,“东南”)
编程使用
audioLabeler
audioLabeler
打开应用程序,使您能够真实的标签对音频数据。
版本历史
介绍了R2018bR2023a:音频贴标签机已被删除
的音频贴标签机应用程序已被删除。使用信号贴标签机代替。
的信号贴标签机应用:
替换文件级别标签属性标签定义full-signal特色。
使用不同的线颜色通道默认的音频文件。
不公开标签标记的标签定义。你不能交互地看到,添加或编辑标签标记标签定义。
提供了两个新的工作流运行时autolabeling算法:
标签和检查策划音频文件。
标签的所有音频文件或音频文件没有检验的一个子集。
不会自动创建标签定义在运行自动化算法。自动化检测的演讲内容,您必须先添加逻辑的(ROI)标签定义。执行“语音转录,首先必须添加字符串ROI标签定义。
需要自动化算法运行在一个频道上。对于多通道音频文件,您可以选择使用哪个频道作为输入。
不提供录音。
R2022a:警告
的音频贴标签机应用程序发出一个警告,它将在未来的版本中被删除。
Abrir比如
这种版本modificada德埃斯特比如。害怕Desea abrir埃斯特比如con sus modificaciones吗?
第一de MATLAB
Ha事实clic en联合国围绕此时一个埃斯特第一de MATLAB:
Ejecute el第一introduciendolo en la ventana de第一de MATLAB。洛杉矶navegadores网络没有admiten第一de MATLAB。
你也可以从下面的列表中选择一个网站:
表现最好的网站怎么走吗
选择中国网站(中文或英文)最佳站点的性能。其他MathWorks国家网站不优化的访问你的位置。