主要内容

声音活动检测器

检测音频信号中的语音存在

  • 库:
  • 音频工具箱/测量

  • 语音活动检测模块

描述

声音活动检测器块检测音频信号中语音的存在。你也可以用the声音活动检测器块输出每个频率仓的噪声方差的估计。

港口

输入

全部展开

  • 矩阵输入 - 输入的每列被视为独立信道。

  • 1-D向量输入 - 输入被视为单个通道。

这个端口是未命名的,除非您指定其他输入端口。

数据类型:|

依赖关系

要启用此端口,请选择指定从输入端口静音到语音的概率为了从沉默帧转换到语音框架的概率参数。

数据类型:|

依赖关系

要启用此端口,请选择从输入端口指定语音到静音的概率为了从讲话框架过渡到沉默框架的概率参数。

数据类型:|

输出

全部展开

块输出与输入信号具有相同列数的标量或行向量。

此端口是未命名的,直到您选择输出噪声方差参数。

数据类型:|

块输出与输入信号具有相同列数的列向量或矩阵。

依赖关系

要启用该端口,请选择输出噪声方差参数。

数据类型:|

参数

全部展开

如果参数被列为可调参数,那么您可以在模拟过程中更改其值。

窗口功能使用以下功能的算法设计:

可调:

依赖关系

要启用该参数,请设置输入域时间

依赖关系

要启用该参数,请设置输入域时间窗口Chebyshev.或者凯撒

数据类型:|

可调:

依赖关系

要启用该参数,请设置输入域时间

可调:

依赖关系

要启用该参数,请设置输入域时间并清楚地清除从输入维度继承FFT长度参数。

数据类型:|

指定从沉默帧转换到语音框架的概率从输入端口,选择指定从输入端口静音到语音的概率

可调:是的

数据类型:|

指定从讲话框架过渡到沉默框架的概率从输入端口,选择从输入端口指定语音到静音的概率

可调:是的

数据类型:|

当你选择这个参数时,一个额外的输出端口,N,被添加到块中。

  • 代码生成- 使用生成的C代码模拟模型。您第一次运行模拟,Simulink万博1manbetx®为代码块生成C代码。只要模型不改变,C代码就可以用于后续的模拟。此选项需要额外的启动时间,但后续模拟的速度可与解释执行

  • 解释执行- 使用MATLAB模拟模型®翻译。此选项减少启动时间,但模拟速度较慢代码生成.在此模式下,您可以调试块的源代码。

可调:

块特征

数据类型

|

直接喂养

多维信号

适应信号

讨论二阶导数过零检测

算法

声音活动检测器实现所描述的算法[1]

如果输入域被指定为时间时,对输入信号加窗,然后根据窗口窗口的侧瓣衰减(DB), 和FFT长度参数。如果输入域被指定为频率,输入为音频信号的加窗离散时间傅里叶变换(DTFT)。然后信号被转换到功率域。噪声方差估计根据[2].根据最小均方误差(MMSE)公式估计后验信噪比和先验信噪比[3].采用基于隐马尔可夫模型(HMM)的延迟方案进行对数似然比检验[1]

参考

孙[1],Jongseo。,Nam Soo Kim, and Wonyong Sung. "A Statistical Model-Based Voice Activity Detection."信号处理字母IEEE.1999年第6卷第1期。

[2]马丁,R。基于最优平滑和最小统计量的噪声功率谱密度估计。IEEE语音和音频处理汇刊.第9卷第5期,2001年,第504-512页。

以法莲,Y.和D.玛拉。用最小均方误差短时谱振幅估计器增强语音。声学,语音和信号处理的IEEE交易.1984年第32卷第6期,1109-1121页。

扩展功能

C / C ++代码生成
使用Simulink®Coder™生成C和c++代码。万博1manbetx

另请参阅

介绍了R2018a