主要内容GydF4y2Ba

MFCC.GydF4y2Ba

提取MFCC,Log Energy,Delta和Delta-Delta的音频信号GydF4y2Ba

描述GydF4y2Ba

例子GydF4y2Ba

COEFFS.GydF4y2Ba= mfcc (GydF4y2BaaudioInGydF4y2Ba那GydF4y2BaFS.GydF4y2Ba)GydF4y2Ba返回音频输入的MEL频率谱系齐数(MFCC),以频率进行采样GydF4y2BaFS.GydF4y2Ba赫兹。GydF4y2Ba

COEFFS.GydF4y2Ba= mfcc (GydF4y2Ba___GydF4y2Ba那GydF4y2Ba名称,价值GydF4y2Ba)GydF4y2Ba使用一个或多个指定选项GydF4y2Ba名称,价值GydF4y2Ba对论点。GydF4y2Ba

例子:GydF4y2Ba多项式系数= mfcc (audioIn、fs“LogEnergy”,“替换”)GydF4y2Ba返回采样的音频输入信号的MEL频率倒谱系数GydF4y2BaFS.GydF4y2Ba赫兹。第一个系数GydF4y2BaCOEFFS.GydF4y2Ba向量被替换成对数能量值。GydF4y2Ba

[GydF4y2BaCOEFFS.GydF4y2Ba那GydF4y2BaδGydF4y2Ba那GydF4y2BadeltaDeltaGydF4y2Ba那GydF4y2Ba座垫GydF4y2Ba) = mfcc (GydF4y2Ba___GydF4y2Ba)GydF4y2Ba还返回与每个数据窗口相对应的delta、delta-delta和样本的位置。GydF4y2Ba

例子GydF4y2Ba

全部收缩GydF4y2Ba

使用该语音信号计算语音信号的MEL频率谱系数GydF4y2BaMFCC.GydF4y2Ba函数。函数返回GydF4y2BaδGydF4y2Ba,系数变化量,和GydF4y2BadeltaDeltaGydF4y2Ba,Delta值的变化。函数计算的日志能量值可以预先提出系数向量或替换系数向量的第一元素。这是根据您是否设置的GydF4y2Ba'logenergy'GydF4y2Ba争论GydF4y2Ba'附加'GydF4y2Ba或GydF4y2Ba“替换”GydF4y2Ba.GydF4y2Ba

从中读取音频信号GydF4y2Ba'Counting-16-44p1-mono-15secs.wav'GydF4y2Ba文件使用GydF4y2BaAudioread.GydF4y2Ba函数。这GydF4y2BaMFCC.GydF4y2Ba函数在批处理中处理整个语音数据。基于输入行的数量,窗口长度和重叠长度,GydF4y2BaMFCC.GydF4y2Ba将语音分区为1551个帧,并计算每个帧的临时特征。每一行GydF4y2BaCOEFFS.GydF4y2Ba矩阵对应于对应于语音文件的相应帧的13麦频谱系数的日志能量值。该功能还计算GydF4y2Ba座垫GydF4y2Ba,每个输入帧中的最后一个样本的位置。GydF4y2Ba

[audioIn, fs] = audioread (GydF4y2Ba'Counting-16-44p1-mono-15secs.wav'GydF4y2Ba);(多项式系数δ,deltaDelta loc) = mfcc (audioIn fs);GydF4y2Ba

读入音频文件并将其转换为频率表示。GydF4y2Ba

[audioIn, fs] = audioread (GydF4y2Ba“Rainbow-16-8-Mono-114secs.wav”GydF4y2Ba);赢得=损害(1024GydF4y2Ba“定期”GydF4y2Ba);s = stft(isainin,GydF4y2Ba“窗户”GydF4y2Ba,赢,GydF4y2Ba“overlaplength”GydF4y2Ba, 512,GydF4y2Ba“中心”GydF4y2Ba、假);GydF4y2Ba

提取熔融频率的肌肉系数,呼叫GydF4y2BaMFCC.GydF4y2Ba与频域音频。忽略log-energy。GydF4y2Ba

多项式系数= mfcc(年代,fs,GydF4y2Ba“Logenergy”GydF4y2Ba那GydF4y2Ba“忽略”GydF4y2Ba);GydF4y2Ba

在许多应用中,MFCC观察转换为汇总统计信息,以供分类任务。绘制敏料谱系数之一的概率密度函数,以观察其分布。GydF4y2Ba

nbins = 60;coefficientToAnalyze =GydF4y2Ba4.GydF4y2Ba;直方图(多项式系数(:,coefficientToAnalyze + 1), nbins,GydF4y2Ba“正常化”GydF4y2Ba那GydF4y2Ba“pdf”GydF4y2Ba)标题(sprintf (GydF4y2Ba“系数% d”GydF4y2Ba,系数进行分析))GydF4y2Ba

图包含轴。具有标题系数4的轴包含类型直方图的对象。GydF4y2Ba

输入参数GydF4y2Ba

全部收缩GydF4y2Ba

输入信号,指定为向量,矩阵或3-D阵列。GydF4y2Ba

  • 如果GydF4y2BaaudioInGydF4y2Ba为实数时,它被解释为时域信号,并且必须是列向量或矩阵。矩阵的列被视为独立的音频通道。GydF4y2Ba

  • 如果GydF4y2BaaudioInGydF4y2Ba是复杂的,它被解释为频域信号。在这种情况下,GydF4y2BaaudioInGydF4y2Ba必须是AN.GydF4y2BaL.GydF4y2Ba-经过-GydF4y2BamGydF4y2Ba-经过-GydF4y2BaNGydF4y2Ba数组,GydF4y2BaL.GydF4y2Ba为DFT点的个数,GydF4y2BamGydF4y2Ba是单独的频谱数量,还有GydF4y2BaNGydF4y2Ba为单个通道的数量。GydF4y2Ba

数据类型:GydF4y2Ba单GydF4y2Ba|GydF4y2Ba双倍的GydF4y2Ba
复数支持:万博1manbetxGydF4y2Ba是的GydF4y2Ba

输入信号的采样率(Hz),指定为一个正标量。GydF4y2Ba

数据类型:GydF4y2Ba单GydF4y2Ba|GydF4y2Ba双倍的GydF4y2Ba

名称值对参数GydF4y2Ba

指定可选的逗号分离对GydF4y2Ba名称,价值GydF4y2Ba论点。GydF4y2Ba的名字GydF4y2Ba是参数名称和GydF4y2Ba价值GydF4y2Ba为对应值。GydF4y2Ba的名字GydF4y2Ba必须出现在引号内。您可以以任何顺序指定多个名称和值对参数GydF4y2Baname1,value1,...,namen,valuenGydF4y2Ba.GydF4y2Ba

例子:GydF4y2Ba(多项式系数δ,deltaDelta loc) = mfcc (audioIn、fs“LogEnergy”,“替换”,“DeltaWindowLength”,5)GydF4y2Ba返回采样的音频输入信号的MEL频率倒谱系数GydF4y2BaFS.GydF4y2Ba赫兹。第一个系数GydF4y2BaCOEFFS.GydF4y2Ba向量被替换成对数能量值。一组5个倒向系数用于计算delta和delta-delta值。GydF4y2Ba

应用于时域的窗口,指定为逗号分隔对GydF4y2Ba“窗口”GydF4y2Ba和一个真正的矢量。向量中的元素数必须在范围[1,GydF4y2Ba大小(GydF4y2BaaudioInGydF4y2Ba1)GydF4y2Ba]。矢量中的元素数量也必须大于GydF4y2BaovertaplenthGydF4y2Ba.GydF4y2Ba

数据类型:GydF4y2Ba单GydF4y2Ba|GydF4y2Ba双倍的GydF4y2Ba

在相邻窗口之间重叠的样本数,指定为包括的逗号分隔对GydF4y2Ba“OverlapLength”GydF4y2Ba和一个范围为[0,GydF4y2Banumel(GydF4y2Ba窗口GydF4y2Ba)GydF4y2Ba).如果未指定的,GydF4y2BaovertaplenthGydF4y2Ba默认为GydF4y2Ba圆形(0.02 *GydF4y2BaFS.GydF4y2Ba)GydF4y2Ba.GydF4y2Ba

数据类型:GydF4y2Ba单GydF4y2Ba|GydF4y2Ba双倍的GydF4y2Ba

每个数据窗口返回的系数数,指定为范围的整数[2GydF4y2BaV.GydF4y2Ba], 在哪里GydF4y2BaV.GydF4y2Ba是有效的密码带数。GydF4y2Ba

有效通带的数量定义为GydF4y2Ba总和(带边<=楼层(FS / 2)) - 2GydF4y2Ba.如果通频带的边在下面,则通频带是有效的GydF4y2BaFS / 2.GydF4y2Ba,在那里GydF4y2BaFS.GydF4y2Ba为输入音频信号的采样率,指定为第二个参数,GydF4y2BaFS.GydF4y2Ba.GydF4y2Ba

数据类型:GydF4y2Ba单GydF4y2Ba|GydF4y2Ba双倍的GydF4y2Ba

以Hz为单位的滤波器组带边,指定为在[0,GydF4y2BaFS.GydF4y2Ba/ 2]。带边的数量必须在范围内[4,160]。这GydF4y2BaMFCC.GydF4y2Ba基于功能设计的半重叠三角形滤波器GydF4y2BaBandEdgesGydF4y2Ba.这意味着所有的频带边缘,除了第一个和最后一个,也是设计的带通滤波器的中心频率。GydF4y2Ba

默认情况下,GydF4y2BaBandEdgesGydF4y2Ba是一个42个元素的向量,它产生一个40个波段的滤波器组,大约跨越133 Hz到6864 Hz。默认带的间隔如GydF4y2Ba[2]GydF4y2Ba.GydF4y2Ba

数据类型:GydF4y2Ba单GydF4y2Ba|GydF4y2Ba双倍的GydF4y2Ba

用于计算窗口输入样本的离散傅立叶变换(DFT)的频体数。FFT长度必须大于或等于所元素的数量GydF4y2Ba窗口GydF4y2Ba.GydF4y2Ba

数据类型:GydF4y2Ba单GydF4y2Ba|GydF4y2Ba双倍的GydF4y2Ba

在离散余弦变换之前应用的非线性整流类型,指定为GydF4y2Ba'日志'GydF4y2Ba或GydF4y2Ba'立方根'GydF4y2Ba.GydF4y2Ba

数据类型:GydF4y2BacharGydF4y2Ba|GydF4y2Ba字符串GydF4y2Ba

用于计算Delta和Delta-Delta值的系数的数量指定为逗号分隔的对GydF4y2Ba'deltawindowlength'GydF4y2Ba和一个大于2的奇数。如果未指定的,GydF4y2Badeltawindowlength.GydF4y2Ba默认为GydF4y2Ba9.GydF4y2Ba.GydF4y2Ba

函数是用GydF4y2Baaudiodetta.GydF4y2Ba函数。GydF4y2Ba

数据类型:GydF4y2Ba单GydF4y2Ba|GydF4y2Ba双倍的GydF4y2Ba

指定如何在系数矢量输出中显示log能量,指定为:GydF4y2Ba

  • '附加'GydF4y2Ba- 该功能将日志能量添加到系数向量。系数矢量的长度为1 +GydF4y2Banumcoeffs.GydF4y2Ba.GydF4y2Ba

  • “替换”GydF4y2Ba- 该函数用信号的日志能量替换第一个系数。系数矢量的长度是GydF4y2Banumcoeffs.GydF4y2Ba.GydF4y2Ba

  • '忽略'GydF4y2Ba——该对象不计算或返回日志能量。GydF4y2Ba

数据类型:GydF4y2BacharGydF4y2Ba|GydF4y2Ba字符串GydF4y2Ba

输出参数GydF4y2Ba

全部收缩GydF4y2Ba

梅尔频率患者系数,作为一个返回GydF4y2BaL.GydF4y2Ba-经过-GydF4y2BamGydF4y2Ba矩阵或矩阵GydF4y2BaL.GydF4y2Ba-经过-GydF4y2BamGydF4y2Ba-经过-GydF4y2BaNGydF4y2Ba数组,其中:GydF4y2Ba

  • L.GydF4y2Ba- 分析窗口的窗口音频信号被划分为。输入大小,GydF4y2Ba窗口GydF4y2Ba,GydF4y2BaovertaplenthGydF4y2Ba控制这个尺寸:GydF4y2BaL.GydF4y2Ba地板=((大小(GydF4y2BaaudioInGydF4y2Ba1)−元素个数(GydF4y2Ba窗口GydF4y2Ba)))/(GydF4y2Banumel(窗口)GydF4y2Ba−GydF4y2BaovertaplenthGydF4y2Ba)+ 1GydF4y2Ba.GydF4y2Ba

  • mGydF4y2Ba- 每帧返回的系数数。该值由此确定GydF4y2Banumcoeffs.GydF4y2Ba和GydF4y2BaLogenergyGydF4y2Ba.GydF4y2Ba

    什么时候GydF4y2BaLogenergyGydF4y2Ba被设定为:GydF4y2Ba

    • '附加'GydF4y2Ba- 该函数将日志能量值添加到系数向量。系数矢量的长度为1 +GydF4y2Banumcoeffs.GydF4y2Ba.GydF4y2Ba

    • “替换”GydF4y2Ba- 该函数用信号的日志能量替换第一个系数。系数矢量的长度是GydF4y2Banumcoeffs.GydF4y2Ba.GydF4y2Ba

    • '忽略'GydF4y2Ba——函数不计算或返回日志能量。系数矢量的长度是GydF4y2Banumcoeffs.GydF4y2Ba.GydF4y2Ba

  • NGydF4y2Ba- 输入通道数(列)。这个值是GydF4y2Ba大小(GydF4y2BaaudioInGydF4y2Ba2)GydF4y2Ba.GydF4y2Ba

数据类型:GydF4y2Ba单GydF4y2Ba|GydF4y2Ba双倍的GydF4y2Ba

从一个数据帧到另一帧的系数的变化,作为一个GydF4y2BaL.GydF4y2Ba-经过-GydF4y2BamGydF4y2Ba矩阵或矩阵GydF4y2BaL.GydF4y2Ba-经过-GydF4y2BamGydF4y2Ba-经过-GydF4y2BaNGydF4y2Ba数组中。这GydF4y2BaδGydF4y2Ba数组的大小和数据类型与GydF4y2BaCOEFFS.GydF4y2Ba数组中。GydF4y2Ba

数据类型:GydF4y2Ba单GydF4y2Ba|GydF4y2Ba双倍的GydF4y2Ba

在某一方面的变化GydF4y2BaδGydF4y2Ba从一个数据帧到另一帧的值,作为一个GydF4y2BaL.GydF4y2Ba-经过-GydF4y2BamGydF4y2Ba矩阵或矩阵GydF4y2BaL.GydF4y2Ba-经过-GydF4y2BamGydF4y2Ba-经过-GydF4y2BaNGydF4y2Ba数组中。这GydF4y2BadeltaDeltaGydF4y2Ba数组的大小和数据类型与GydF4y2BaCOEFFS.GydF4y2Ba和GydF4y2BaδGydF4y2Ba数组。GydF4y2Ba

数据类型:GydF4y2Ba单GydF4y2Ba|GydF4y2Ba双倍的GydF4y2Ba

每个分析窗口中最后一个样本的位置,作为列向量返回,具有相同数量的行数GydF4y2BaCOEFFS.GydF4y2Ba.GydF4y2Ba

数据类型:GydF4y2Ba单GydF4y2Ba|GydF4y2Ba双倍的GydF4y2Ba

算法GydF4y2Ba

MEL频率谱系数是从语音信号中提取的流行功能,以便用于识别任务。在语音源滤波器模型中,临时谱系数应理解为代表过滤器(声道)。声带频率响应相对平滑,而浊音的来源可以被建模为脉冲列车。结果,可以通过语音段的光谱包络估计声道。GydF4y2Ba

MEL频率谱系数的激励思想是基于对耳蜗的理解将关于声道(平滑光谱)的信息压缩成少数系数。虽然没有用于计算系数的硬标准,但图表概述了基本步骤。GydF4y2Ba

默认的MEL滤波器组线性地空间为前10个三角形过滤器并对数空间剩余过滤器。GydF4y2Ba

Zeroth MEL频率谱系区中包含的信息通常由日志能量增强或替换。日志能量计算取决于输入域。GydF4y2Ba

如果输入(GydF4y2BaaudioInGydF4y2Ba)为时域信号,其对数能量计算公式如下:GydF4y2Ba

日志GydF4y2Ba E.GydF4y2Ba =GydF4y2Ba 日志GydF4y2Ba (GydF4y2Ba 总和GydF4y2Ba (GydF4y2Ba XGydF4y2Ba 2GydF4y2Ba )GydF4y2Ba )GydF4y2Ba

如果输入(GydF4y2BaaudioInGydF4y2Ba)是一个频域信号,使用以下等式计算日志能量:GydF4y2Ba

日志GydF4y2Ba E.GydF4y2Ba =GydF4y2Ba 日志GydF4y2Ba (GydF4y2Ba 总和GydF4y2Ba (GydF4y2Ba |GydF4y2Ba XGydF4y2Ba |GydF4y2Ba 2GydF4y2Ba )GydF4y2Ba /GydF4y2Ba FGydF4y2Ba FGydF4y2Ba T.GydF4y2Ba L.GydF4y2Ba E.GydF4y2Ba NGydF4y2Ba GGydF4y2Ba T.GydF4y2Ba HGydF4y2Ba )GydF4y2Ba

兼容性的考虑GydF4y2Ba

全部展开GydF4y2Ba

行为在R2020b中改变GydF4y2Ba

未来发布的行为变化GydF4y2Ba

参考GydF4y2Ba

Rabiner, Lawrence R.和Ronald W. Schafer。GydF4y2Ba数字语音处理理论与应用GydF4y2Ba.上部马鞍河,NJ:2010年Pearson。GydF4y2Ba

扩展功能GydF4y2Ba

C / C ++代码生成GydF4y2Ba
使用MATLAB®Coder™生成C和c++代码。GydF4y2Ba

GPU的代码生成GydF4y2Ba
使用GPU Coder™为NVIDIA®GPU生成CUDA®代码。GydF4y2Ba

GPU数组GydF4y2Ba
使用并行计算工具箱™在图形处理单元(GPU)上运行加速代码。GydF4y2Ba

在R2018A介绍GydF4y2Ba