提取MFCC,Log Energy,Delta和Delta-Delta的音频信号GydF4y2Ba
返回音频输入的MEL频率谱系齐数(MFCC),以频率进行采样GydF4y2BaCOEFFS.GydF4y2Ba
= mfcc (GydF4y2BaaudioInGydF4y2Ba
那GydF4y2BaFS.GydF4y2Ba
)GydF4y2BaFS.GydF4y2Ba
赫兹。GydF4y2Ba
使用一个或多个指定选项GydF4y2BaCOEFFS.GydF4y2Ba
= mfcc (GydF4y2Ba___GydF4y2Ba那GydF4y2Ba名称,价值GydF4y2Ba
)GydF4y2Ba名称,价值GydF4y2Ba
对论点。GydF4y2Ba
多项式系数= mfcc (audioIn、fs“LogEnergy”,“替换”)GydF4y2Ba
返回采样的音频输入信号的MEL频率倒谱系数GydF4y2BaFS.GydF4y2Ba
赫兹。第一个系数GydF4y2BaCOEFFS.GydF4y2Ba
向量被替换成对数能量值。GydF4y2Ba
[GydF4y2Ba
还返回与每个数据窗口相对应的delta、delta-delta和样本的位置。GydF4y2BaCOEFFS.GydF4y2Ba
那GydF4y2BaδGydF4y2Ba
那GydF4y2BadeltaDeltaGydF4y2Ba
那GydF4y2Ba座垫GydF4y2Ba
) = mfcc (GydF4y2Ba___GydF4y2Ba)GydF4y2Ba
MEL频率谱系数是从语音信号中提取的流行功能,以便用于识别任务。在语音源滤波器模型中,临时谱系数应理解为代表过滤器(声道)。声带频率响应相对平滑,而浊音的来源可以被建模为脉冲列车。结果,可以通过语音段的光谱包络估计声道。GydF4y2Ba
MEL频率谱系数的激励思想是基于对耳蜗的理解将关于声道(平滑光谱)的信息压缩成少数系数。虽然没有用于计算系数的硬标准,但图表概述了基本步骤。GydF4y2Ba
默认的MEL滤波器组线性地空间为前10个三角形过滤器并对数空间剩余过滤器。GydF4y2Ba
Zeroth MEL频率谱系区中包含的信息通常由日志能量增强或替换。日志能量计算取决于输入域。GydF4y2Ba
如果输入(GydF4y2BaaudioInGydF4y2Ba)为时域信号,其对数能量计算公式如下:GydF4y2Ba
如果输入(GydF4y2BaaudioInGydF4y2Ba)是一个频域信号,使用以下等式计算日志能量:GydF4y2Ba
Rabiner, Lawrence R.和Ronald W. Schafer。GydF4y2Ba数字语音处理理论与应用GydF4y2Ba.上部马鞍河,NJ:2010年Pearson。GydF4y2Ba
audiodetta.GydF4y2Ba
|GydF4y2Baaudiofeatureextractor.GydF4y2Ba
|GydF4y2Ba抗痉挛特征提取器GydF4y2Ba|GydF4y2BacepstralCoefficientsGydF4y2Ba
|GydF4y2Ba检测GydF4y2Ba