提取音频信号的MFCC、对数能量、增量和增量GydF4y2Ba
返回音频输入的mel频率倒谱系数(MFCC),以GydF4y2Ba非零系数GydF4y2Ba
= MFCC(GydF4y2Ba奥地策GydF4y2Ba
,GydF4y2Ba财政司司长GydF4y2Ba
)GydF4y2Ba财政司司长GydF4y2Ba
赫兹。GydF4y2Ba
使用一个或多个指定选项GydF4y2Ba非零系数GydF4y2Ba
= MFCC(GydF4y2Ba___GydF4y2Ba,GydF4y2Ba名称、值GydF4y2Ba
)GydF4y2Ba名称、值GydF4y2Ba
配对参数。GydF4y2Ba
Coeffs = MFCC(AudioIn,FS,'Logenergy','替换')GydF4y2Ba
返回用于采样的音频输入信号的MEL频率谱系齐数GydF4y2Ba财政司司长GydF4y2Ba
赫兹。第一个系数GydF4y2Ba非零系数GydF4y2Ba
向量替换为对数能量值。GydF4y2Ba
[GydF4y2Ba
还返回与每个数据窗口对应的样本的Delta,delta-delta和位置。GydF4y2Ba非零系数GydF4y2Ba
,GydF4y2Ba三角洲GydF4y2Ba
,GydF4y2BadeltadeltaGydF4y2Ba
,GydF4y2BalocGydF4y2Ba
] = MFCC(GydF4y2Ba___GydF4y2Ba)GydF4y2Ba
Mel倒谱系数是从语音信号中提取的常用特征,用于识别任务。在语音的源滤波器模型中,倒谱系数被理解为代表滤波器(声道)。声道的频率响应相对平稳,而浊音的来源可以建模为脉冲序列。因此,可以通过语音片段的频谱包络来估计声道。GydF4y2Ba
mel频率倒谱系数的激励思想是基于对耳蜗的理解,将有关声道(平滑频谱)的信息压缩为少量系数。虽然没有计算系数的硬标准,但图中概述了基本步骤。GydF4y2Ba
默认mel过滤器组线性分隔前10个三角形过滤器,对数分隔其余过滤器。GydF4y2Ba
第0个mel倒谱系数中包含的信息通常会被对数能量增加或替换。对数能量的计算取决于输入域。GydF4y2Ba
如果输入(GydF4y2Ba奥地策GydF4y2Ba)是一个时域信号,使用以下等式计算日志能量:GydF4y2Ba
如果输入(GydF4y2Ba奥地策GydF4y2Ba)是频域信号,则使用以下等式计算对数能量:GydF4y2Ba
[1] Rabiner,Lawrence R.和Ronald W. Schafer。GydF4y2Ba数字语音处理的理论与应用GydF4y2Ba. 新泽西州上鞍河:皮尔森,2010年。GydF4y2Ba
倒谱特征提取GydF4y2Ba|GydF4y2Ba音频特征提取器GydF4y2Ba
|GydF4y2Ba音频三角洲GydF4y2Ba
|GydF4y2BaCepstralcoeffients.GydF4y2Ba
|GydF4y2Ba侦探讲话GydF4y2Ba