主要内容

分割

检测和隔离的演讲和其他声音

检测的演讲和其他声音和定位他们的开始和结束时间。对于流媒体应用程序,使用语音活动检测(VAD)输出的概率语言是存在于一个给定的框架。您还可以使用speech2text为语音信号创建time-aligned词标签。

应用程序

信号贴标签机 标签信号属性、地区的兴趣点,提取特征

对象

voiceActivityDetector 检测存在语音音频信号

功能

detectspeechnn 使用人工智能检测边界的演讲音频信号
detectSpeech 检测音频信号的言论边界
classifySound 在音频信号进行分类

声音活动检测器 检测存在语音音频信号