主要内容

MFCC

从音频提取mel-frequency cepstral系数

自从R2022b

  • MFCC块

库:
音频工具箱/功能

描述

MFCC块提取特征向量包含mel-frequency cepstral系数(MFCCs),以及他们的三角洲和δ特性,从音频输入信号。MFCCs流行从语音信号中提取特征用于分类的任务。

港口

输入

全部展开

音频输入信号,指定为一个列向量或矩阵。当你指定一个矩阵,块将列视为独立的音频通道。

数据类型:|

输出

全部展开

MFCC特征作为一个矩阵或三维数组返回。功能包括MFCCs本身和可选地包括三角洲和δMFCCs的特性。输出的尺寸l——- - - - - -——- - - - - -N,地点:

后的尺寸大小1从输出中删除。

数据类型:|

参数

全部展开

Mel-Frequency Cepstral系数

分析窗口应用于输入信号在时域,指定为一个真正的向量。

相邻窗口之间的重叠的样本数量,指定为一个整数范围在[0,windowLength),windowLength分析窗口的长度是指定的吗窗口参数。

每个特性的cepstral系数向量,指定为一个大于1的正整数。

类型的非线性校正应用于谱离散余弦变换前,指定为对数立方根

当您选择该参数时,块附加的三角洲MFCCs系数在每个特征向量。三角洲是一个近似的MFCCs对时间的一阶导数。三角洲特征的数量等于MFCCs的数量,这是规定许多cepstral系数

当您选择该参数时,块附加的δMFCCs每个输出的特征向量。δ是一个近似的MFCCs关于时间的二阶导数。δ特性的数量等于MFCCs的数量,这是规定许多cepstral系数

块附加后的δδ在特征向量也如果你选择附加δ参数。

数量的计算系数δδ,指定为奇数大于2。

输出缓冲

输出的MFCC特征向量数量,指定为一个正整数。块缓冲区输出返回指定数目的特征向量。

特征向量的数块重叠在输出中,指定为一个非负整数比特征向量的数量

仿真参数

当您选择该参数,块继承其输入信号的采样率。当你清楚这个参数,指定的采样率输入采样率(赫兹)参数。

输入采样率在赫兹,指定为一个积极的标量。

依赖关系

要启用该参数,清除继承从输入采样率参数。

梅尔·滤波器组设计

梅尔·滤波器组的乐队,指定为一个正整数。

当您选择该参数,设置频率范围[0,fs / 2),在那里fs采样率。块决定了采样率使用继承从输入采样率输入采样率(赫兹)参数。

赫兹频率范围的梅尔·滤波器组,指定为一个双元素行向量。

依赖关系

要启用该参数,清除Auto-determine频率范围参数。

梅尔·滤波器组的设计领域,指定为线性扭曲的

块使用标准化技术的滤波器组重量、指定为带宽,区域,或没有一个

  • 带宽——标准化权重对应每一个带通滤波器的带宽的过滤器。

  • 区域——正常的重量对应区域的带通滤波器的带通滤波器。

  • 没有一个——块不正常重量的过滤器。

光谱图

当您选择该参数时,块标准化应用窗口。

类型的光谱,指定为权力

当您选择该参数时,块自动设置FFT长度到窗口长度。窗口长度决定的窗口参数。

点数用来计算DFT,指定为一个正整数。

依赖关系

要启用该参数,清除Auto-determine FFT长度参数。

块特征

数据类型

|

直接引线

没有

多维信号

没有

适应信号

没有

讨论二阶导数过零检测

没有

算法

全部展开

扩展功能

版本历史

介绍了R2022b

全部展开