主要内容GydF4y2Ba

mfccGydF4y2Ba

提取音频信号的MFCC、对数能量、增量和增量GydF4y2Ba

描述GydF4y2Ba

实例GydF4y2Ba

非零系数GydF4y2Ba= MFCC(GydF4y2Ba奥地策GydF4y2Ba,GydF4y2Ba财政司司长GydF4y2Ba)GydF4y2Ba返回音频输入的mel频率倒谱系数(MFCC),以GydF4y2Ba财政司司长GydF4y2Ba赫兹。GydF4y2Ba

非零系数GydF4y2Ba= MFCC(GydF4y2Ba___GydF4y2Ba,GydF4y2Ba名称、值GydF4y2Ba)GydF4y2Ba使用一个或多个指定选项GydF4y2Ba名称、值GydF4y2Ba配对参数。GydF4y2Ba

例子:GydF4y2BaCoeffs = MFCC(AudioIn,FS,'Logenergy','替换')GydF4y2Ba返回用于采样的音频输入信号的MEL频率谱系齐数GydF4y2Ba财政司司长GydF4y2Ba赫兹。第一个系数GydF4y2Ba非零系数GydF4y2Ba向量替换为对数能量值。GydF4y2Ba

[GydF4y2Ba非零系数GydF4y2Ba,GydF4y2Ba三角洲GydF4y2Ba,GydF4y2BadeltadeltaGydF4y2Ba,GydF4y2BalocGydF4y2Ba] = MFCC(GydF4y2Ba___GydF4y2Ba)GydF4y2Ba还返回与每个数据窗口对应的样本的Delta,delta-delta和位置。GydF4y2Ba

例子GydF4y2Ba

全部崩溃GydF4y2Ba

使用GydF4y2BamfccGydF4y2Ba函数。函数返回GydF4y2Ba三角洲GydF4y2Ba,系数的变化,以及GydF4y2BadeltadeltaGydF4y2Ba,增量值的变化。函数计算的对数能量值可以前置系数向量或替换系数向量的第一个元素。这取决于是否设置GydF4y2Ba“LogEnergy”GydF4y2Ba论据GydF4y2Ba“追加”GydF4y2Ba或者GydF4y2Ba'代替'GydF4y2Ba.GydF4y2Ba

从扬声器中读取音频信号GydF4y2Ba“计数-16-44p1-mono-15秒波形”GydF4y2Ba使用GydF4y2Ba音频读物GydF4y2Ba作用这个GydF4y2BamfccGydF4y2Ba函数批量处理整个语音数据。根据输入行数、窗口长度和重叠长度,GydF4y2BamfccGydF4y2Ba将语音划分为1551帧,并计算每帧的倒谱特征GydF4y2Ba非零系数GydF4y2Ba矩阵对应于语音文件对应帧的对数能量值,后跟13个mel频率倒谱系数。该函数还计算GydF4y2BalocGydF4y2Ba,每个输入帧中最后一个样本的位置。GydF4y2Ba

[AudioIn,FS] = audioread(GydF4y2Ba“计数-16-44p1-mono-15秒波形”GydF4y2Ba);[coeffs,delta,deltadelta,loc] = MFCC(AudioIn,FS);GydF4y2Ba

在音频文件中读取并将其转换为频率表示。GydF4y2Ba

[AudioIn,FS] = audioread(GydF4y2Ba“彩虹-16-8-mono-114s.wav”GydF4y2Ba);WIN = HANN(1024,GydF4y2Ba“定期”GydF4y2Ba);S=stft(音频输入,GydF4y2Ba“窗口”GydF4y2Ba赢GydF4y2Ba“重叠长度”GydF4y2Ba512,GydF4y2Ba“以”为中心“GydF4y2Ba,错误的);GydF4y2Ba

要提取mel频率倒谱系数,请调用GydF4y2BamfccGydF4y2Ba使用频域音频。忽略日志能量。GydF4y2Ba

Coeffs = MFCC(S,FS,GydF4y2Ba“LogEnergy”GydF4y2Ba,GydF4y2Ba“忽略”GydF4y2Ba);GydF4y2Ba

在许多应用中,MFCC观测值被转换为汇总统计数据,用于分类任务。为其中一个mel频率倒谱系数绘制概率密度函数,以观察其分布。GydF4y2Ba

nbins = 60;CoeffiountoAnalyze =GydF4y2Ba4.GydF4y2Ba;直方图(COEFFS(:,系数毒性+ 1),nbins,GydF4y2Ba“正常化”GydF4y2Ba,GydF4y2Ba“pdf”GydF4y2Ba)标题(Sprintf(GydF4y2Ba“系数%d”GydF4y2Ba,分析的系数)GydF4y2Ba

图包含轴对象。具有标题系数4的轴对象包含类型直方图的对象。GydF4y2Ba

输入参数GydF4y2Ba

全部崩溃GydF4y2Ba

输入信号,指定为矢量、矩阵或三维阵列。GydF4y2Ba

  • 如果GydF4y2Ba奥地策GydF4y2Ba是真实的,它被解释为时域信号,必须是列向量或矩阵。矩阵的列被视为独立的音频通道。GydF4y2Ba

  • 如果GydF4y2Ba奥地策GydF4y2Ba它是复杂的,被解释为频域信号。在这种情况下,,GydF4y2Ba奥地策GydF4y2Ba一定是一个GydF4y2BaLGydF4y2Ba-借-GydF4y2BaMGydF4y2Ba-借-GydF4y2BaNGydF4y2Ba阵列,其中GydF4y2BaLGydF4y2Ba是DFT点数,GydF4y2BaMGydF4y2Ba是单个光谱的数量,以及GydF4y2BaNGydF4y2Ba是个人渠道的数量。GydF4y2Ba

数据类型:GydF4y2Ba单身的GydF4y2Ba|GydF4y2Ba双重的GydF4y2Ba
复数支持:万博1manbetxGydF4y2Ba是的GydF4y2Ba

Hz中输入信号的采样率,指定为正标量。GydF4y2Ba

数据类型:GydF4y2Ba单身的GydF4y2Ba|GydF4y2Ba双重的GydF4y2Ba

名称值参数GydF4y2Ba

指定可选的逗号分隔的字符对GydF4y2Ba名称、值GydF4y2Ba论据。GydF4y2Ba姓名GydF4y2Ba是参数名和GydF4y2Ba价值GydF4y2Ba是相应的价值。GydF4y2Ba姓名GydF4y2Ba必须出现在引号内。您可以按任意顺序指定多个名称和值对参数,如下所示:GydF4y2Ba名称1,值1,…,名称,值GydF4y2Ba.GydF4y2Ba

例子:GydF4y2Ba[Coeffs,Delta,DeltaDelta,Loc] = MFCC(AudioIn,FS,'Logenergy','替换','deltawindowlength',5)GydF4y2Ba返回用于采样的音频输入信号的MEL频率谱系齐数GydF4y2Ba财政司司长GydF4y2Ba赫兹。第一个系数GydF4y2Ba非零系数GydF4y2Ba向量替换为对数能量值。一组5个谱谱系数用于计算Delta和Delta-Delta值。GydF4y2Ba

应用于时域的窗口,指定为逗号分隔对,由GydF4y2Ba'窗户'GydF4y2Ba和一个实向量。向量中的元素数必须在[1,GydF4y2Ba尺寸(GydF4y2Ba奥地策GydF4y2Ba,1)GydF4y2Ba]。向量中的元素数也必须大于GydF4y2Ba重叠长度GydF4y2Ba.GydF4y2Ba

数据类型:GydF4y2Ba单身的GydF4y2Ba|GydF4y2Ba双重的GydF4y2Ba

相邻窗口之间重叠的样本数,指定为逗号分隔对,由GydF4y2Ba'overlaplencth'GydF4y2Ba并且范围内的整数[0,GydF4y2Ba努梅尔(GydF4y2Ba窗户GydF4y2Ba)GydF4y2Ba)。如果未指定,GydF4y2Ba重叠长度GydF4y2Ba默认为GydF4y2Ba圆形(0.02*GydF4y2Ba财政司司长GydF4y2Ba)GydF4y2Ba.GydF4y2Ba

数据类型:GydF4y2Ba单身的GydF4y2Ba|GydF4y2Ba双重的GydF4y2Ba

为每个数据窗口返回的系数数,指定为[2]范围内的整数GydF4y2BavGydF4y2Ba],在哪里GydF4y2BavGydF4y2Ba是有效通带的数量。GydF4y2Ba

有效通带的数量定义为GydF4y2Ba总和(带边<=地板(fs/2))-2GydF4y2Ba.如果它的边缘下降,通带是有效的GydF4y2Bafs/2GydF4y2Ba, 在哪里GydF4y2Ba财政司司长GydF4y2Ba是输入音频信号的采样率,指定为第二个参数,GydF4y2Ba财政司司长GydF4y2Ba.GydF4y2Ba

数据类型:GydF4y2Ba单身的GydF4y2Ba|GydF4y2Ba双重的GydF4y2Ba

滤波器组的带边,单位为Hz,指定为[0]范围内的非负单调递增行向量,GydF4y2Ba财政司司长GydF4y2Ba/2] 。带区边数必须在[4160]范围内。带区边数GydF4y2BamfccGydF4y2Ba功能设计了基于的半重叠三角形滤波器GydF4y2Ba绑架GydF4y2Ba.这意味着除了第一个和最后一个外,所有带边都也是设计的带通滤波器的中心频率。GydF4y2Ba

默认情况下,GydF4y2Ba绑架GydF4y2Ba是一个42元素矢量,导致40带滤波器组,跨越大约133 Hz至6864 Hz。默认频带按照描述间隔开GydF4y2Ba[2]GydF4y2Ba.GydF4y2Ba

数据类型:GydF4y2Ba单身的GydF4y2Ba|GydF4y2Ba双重的GydF4y2Ba

用于计算加窗输入样本的离散傅里叶变换(DFT)的存储单元数。FFT长度必须大于或等于存储单元中的元素数GydF4y2Ba窗户GydF4y2Ba.GydF4y2Ba

数据类型:GydF4y2Ba单身的GydF4y2Ba|GydF4y2Ba双重的GydF4y2Ba

在离散余弦变换之前应用的非线性校正类型,指定为GydF4y2Ba“日志”GydF4y2Ba或者GydF4y2Ba“立方根”GydF4y2Ba.GydF4y2Ba

数据类型:GydF4y2Ba烧焦GydF4y2Ba|GydF4y2Ba细绳GydF4y2Ba

用于计算增量和增量增量值的系数数,指定为逗号分隔对,包括GydF4y2Ba“DeltaWindowLength”GydF4y2Ba和大于两个的奇数整数。如果未指定,GydF4y2Ba三角窗长度GydF4y2Ba默认为GydF4y2Ba9GydF4y2Ba.GydF4y2Ba

使用Δ使用Δ使用GydF4y2Ba音频三角洲GydF4y2Ba作用GydF4y2Ba

数据类型:GydF4y2Ba单身的GydF4y2Ba|GydF4y2Ba双重的GydF4y2Ba

指定如何在系数向量输出中显示日志能量,指定为:GydF4y2Ba

  • “追加”GydF4y2Ba–函数将对数能量前置到系数向量。系数向量的长度为1+GydF4y2Ba努姆科夫斯GydF4y2Ba.GydF4y2Ba

  • '代替'GydF4y2Ba–该函数用信号的对数能量替换第一个系数。系数向量的长度为GydF4y2Ba努姆科夫斯GydF4y2Ba.GydF4y2Ba

  • “忽略”GydF4y2Ba- 对象不计算或返回日志能量。GydF4y2Ba

数据类型:GydF4y2Ba烧焦GydF4y2Ba|GydF4y2Ba细绳GydF4y2Ba

输出参数GydF4y2Ba

全部崩溃GydF4y2Ba

Mel频率倒谱系数,作为GydF4y2BaLGydF4y2Ba-借-GydF4y2BaMGydF4y2Ba矩阵或GydF4y2BaLGydF4y2Ba-借-GydF4y2BaMGydF4y2Ba-借-GydF4y2BaNGydF4y2Ba数组,其中:GydF4y2Ba

  • LGydF4y2Ba–音频信号划分到的分析窗口数。输入大小,GydF4y2Ba窗户GydF4y2Ba, 和GydF4y2Ba重叠长度GydF4y2Ba控制这个维度:GydF4y2BaLGydF4y2Ba=楼层((大小(GydF4y2Ba奥地策GydF4y2Ba,1) - numel(GydF4y2Ba窗户GydF4y2Ba)))/(GydF4y2Ba努梅尔(窗口)GydF4y2Ba-GydF4y2Ba重叠长度GydF4y2Ba) + 1GydF4y2Ba.GydF4y2Ba

  • MGydF4y2Ba–每帧返回的系数数。该值由GydF4y2Ba努姆科夫斯GydF4y2Ba和GydF4y2BaLogEnergyGydF4y2Ba.GydF4y2Ba

    什么时候GydF4y2BaLogEnergyGydF4y2Ba设置为:GydF4y2Ba

    • “追加”GydF4y2Ba–函数将对数能量值前置到系数向量。系数向量的长度为1+GydF4y2Ba努姆科夫斯GydF4y2Ba.GydF4y2Ba

    • '代替'GydF4y2Ba–该函数用信号的对数能量替换第一个系数。系数向量的长度为GydF4y2Ba努姆科夫斯GydF4y2Ba.GydF4y2Ba

    • “忽略”GydF4y2Ba- 该函数不计算或返回日志能量。系数矢量的长度是GydF4y2Ba努姆科夫斯GydF4y2Ba.GydF4y2Ba

  • NGydF4y2Ba–输入通道(列)的数量。此值为GydF4y2Ba尺寸(GydF4y2Ba奥地策GydF4y2Ba,2)GydF4y2Ba.GydF4y2Ba

数据类型:GydF4y2Ba单身的GydF4y2Ba|GydF4y2Ba双重的GydF4y2Ba

从一帧数据到另一帧数据的系数变化,作为GydF4y2BaLGydF4y2Ba-借-GydF4y2BaMGydF4y2Ba矩阵或GydF4y2BaLGydF4y2Ba-借-GydF4y2BaMGydF4y2Ba-借-GydF4y2BaNGydF4y2Ba大堆这个GydF4y2Ba三角洲GydF4y2Ba数组与尺寸和数据类型相同GydF4y2Ba非零系数GydF4y2Ba大堆GydF4y2Ba

数据类型:GydF4y2Ba单身的GydF4y2Ba|GydF4y2Ba双重的GydF4y2Ba

变化GydF4y2Ba三角洲GydF4y2Ba从一个数据帧到另一个数据帧的值,作为GydF4y2BaLGydF4y2Ba-借-GydF4y2BaMGydF4y2Ba矩阵或GydF4y2BaLGydF4y2Ba-借-GydF4y2BaMGydF4y2Ba-借-GydF4y2BaNGydF4y2Ba大堆这个GydF4y2BadeltadeltaGydF4y2Ba数组与尺寸和数据类型相同GydF4y2Ba非零系数GydF4y2Ba和GydF4y2Ba三角洲GydF4y2Ba阵列。GydF4y2Ba

数据类型:GydF4y2Ba单身的GydF4y2Ba|GydF4y2Ba双重的GydF4y2Ba

每个分析窗口中最后一个样本的位置,作为列向量返回,行数与GydF4y2Ba非零系数GydF4y2Ba.GydF4y2Ba

数据类型:GydF4y2Ba单身的GydF4y2Ba|GydF4y2Ba双重的GydF4y2Ba

算法GydF4y2Ba

Mel倒谱系数是从语音信号中提取的常用特征,用于识别任务。在语音的源滤波器模型中,倒谱系数被理解为代表滤波器(声道)。声道的频率响应相对平稳,而浊音的来源可以建模为脉冲序列。因此,可以通过语音片段的频谱包络来估计声道。GydF4y2Ba

mel频率倒谱系数的激励思想是基于对耳蜗的理解,将有关声道(平滑频谱)的信息压缩为少量系数。虽然没有计算系数的硬标准,但图中概述了基本步骤。GydF4y2Ba

默认mel过滤器组线性分隔前10个三角形过滤器,对数分隔其余过滤器。GydF4y2Ba

第0个mel倒谱系数中包含的信息通常会被对数能量增加或替换。对数能量的计算取决于输入域。GydF4y2Ba

如果输入(GydF4y2Ba奥地策GydF4y2Ba)是一个时域信号,使用以下等式计算日志能量:GydF4y2Ba

日志GydF4y2Ba EGydF4y2Ba =GydF4y2Ba 日志GydF4y2Ba (GydF4y2Ba 和GydF4y2Ba (GydF4y2Ba xGydF4y2Ba 2.GydF4y2Ba )GydF4y2Ba )GydF4y2Ba

如果输入(GydF4y2Ba奥地策GydF4y2Ba)是频域信号,则使用以下等式计算对数能量:GydF4y2Ba

日志GydF4y2Ba EGydF4y2Ba =GydF4y2Ba 日志GydF4y2Ba (GydF4y2Ba 和GydF4y2Ba (GydF4y2Ba |GydF4y2Ba xGydF4y2Ba |GydF4y2Ba 2.GydF4y2Ba )GydF4y2Ba /GydF4y2Ba FGydF4y2Ba FGydF4y2Ba TGydF4y2Ba LGydF4y2Ba EGydF4y2Ba NGydF4y2Ba GGydF4y2Ba TGydF4y2Ba HGydF4y2Ba )GydF4y2Ba

兼容性考虑因素GydF4y2Ba

展开全部GydF4y2Ba

R2020B的行为更改GydF4y2Ba

未来版本中的行为更改GydF4y2Ba

工具书类GydF4y2Ba

[1] Rabiner,Lawrence R.和Ronald W. Schafer。GydF4y2Ba数字语音处理的理论与应用GydF4y2Ba. 新泽西州上鞍河:皮尔森,2010年。GydF4y2Ba

扩展能力GydF4y2Ba

C/C++代码生成GydF4y2Ba
使用MATLAB®Coder™生成C和C ++代码。GydF4y2Ba

GPU代码生成GydF4y2Ba
使用GPU Coder™为NVIDIA®GPU生成CUDA®代码。GydF4y2Ba

GPU阵列GydF4y2Ba
使用并行计算工具箱™在图形处理单元(GPU)上运行,加速代码。GydF4y2Ba

R2018a中引入GydF4y2Ba