主要内容

designAuditoryFilterBank

设计听觉滤波器组

描述

例子

filterBank= designAuditoryFilterBank (fs返回一个频域听觉滤波器组,filterBank

例子

filterBank= designAuditoryFilterBank (fs名称,值使用一个或多个指定选项名称,值配对参数。

filterBank足球俱乐部BW) = designAuditoryFilterBank (___返回滤波器组中每个滤波器的中心频率和带宽。您可以将此输出语法与前面的任何输入语法一起使用。

例子

全部折叠

调用designAuditoryFilterBank用指定的采样率来设计默认的听觉滤波器组。

fs = 44.1 e3;fb = designAuditoryFilterBank (fs);

默认滤波器组由32个三角形带通滤波器组成,这些滤波器在mel比例上均匀分布,介于0和0之间fs/ 2赫兹。

数量=尺寸(fb,1)
numBands = 32

designAuditoryFilterBank用于频域滤波。默认情况下,designAuditoryFilterBank假设一个1024点的DFT,返回一个带有513点的半边频域滤波器组。

numPoints =大小(fb, 2)
numPoints = 513

读入音频并将其转换为单侧功率谱。

[audioIn, fs] = audioread (“Laughter-16-8-mono-4secs.wav”);赢得=汉明(1024“周期”);noverlap = 512;fftLength = 1024;F (S, t) = stft (audioIn fs,...“窗口”,赢了,...“OverlapLength”noverlap,...“FFTLength”fftLength,...“FrequencyRange”“单向的”);PowerSpectrum = S *连词(年代);

设计一种基于融合的听觉滤波器组。绘制滤波器组。

麻木=32;范围= [04000];归一化=“带宽”;(fb, cf) = designAuditoryFilterBank (fs,...“FFTLength”fftLength,...“NumBands”,麻木,...“FrequencyRange”、范围、...“归一化”、标准化);情节(F, fb。”)网格标题(“梅尔过滤器银行”)包含(“频率(赫兹)”

图中包含一个轴对象。标题为Mel Filter Bank的轴对象包含32个类型为line的对象。

要应用频域滤波,执行滤波器组和功率谱图的矩阵乘法。

X = fb * PowerSpectrum;

以dB为单位可视化每频带的功率。

XdB = 10 * log10 (X);冲浪(t, cf, XdB“EdgeColor”“没有”);包含(“时间(s)”) ylabel (“频率(赫兹)”) zlabel (“权力(dB)”)视图([45、60])标题(“Mel-Based谱图”)轴牢固的

图中包含一个轴对象。标题为“基于梅尔的光谱图”的轴对象包含一个类型为曲面的对象。

读入音频并将其转换为单侧功率谱。

[audioIn, fs] = audioread (“RockDrums-44p1-stereo-11secs.mp3”);赢得=损害(圆(0.03 * fs),“周期”);noverlap =圆(0.02 * fs);fftLength = 2048;F (S, t) = stft (audioIn fs,...“窗口”,赢了,...“OverlapLength”noverlap,...“FFTLength”fftLength,...“FrequencyRange”“单向的”);PowerSpectrum = S *连词(年代);

设计一种基于bark的听觉滤波器组。绘制滤波器组。

麻木=32;范围= [022050];归一化=“区域”;designDomain =“线性”;(fb, cf) = designAuditoryFilterBank (fs,...“FrequencyScale”“树皮”...“FFTLength”fftLength,...“NumBands”,麻木,...“FrequencyRange”、范围、...“归一化”归一化,...“FilterBankDesignDomain”, designDomain);情节(F, fb。');网格标题(“树皮过滤器银行”)包含(“频率(赫兹)”

图中包含一个轴对象。标题为树皮过滤器组的Axis对象包含32个line类型的对象。

要应用频域滤波,执行滤波器组和左右功率谱图的矩阵乘法。

X = pagemtimes(神奇动物,PowerSpectrum);

以dB为单位可视化每频带的功率。

XLdB = 10 * log10 (X (:,: 1));XRdB = 10 * log10 (X (:,: 2));冲浪(t, cf, XLdB“EdgeColor”“没有”);包含(“时间(s)”) ylabel (“频率(赫兹)”, 90年)视图([0])标题(“基于吠声的声谱图(左通道)”)轴牢固的

图中包含一个轴对象。标题为“基于树皮的光谱图(左通道)”的轴对象包含一个类型为曲面的对象。

冲浪(t, cf, XRdB“EdgeColor”“没有”);包含(“时间(s)”) ylabel (“频率(赫兹)”, 90年)视图([0])标题(“基于吠声的声谱图(右通道)”)轴牢固的

图中包含一个轴对象。标题为“基于树皮的光谱图(右通道)”的轴对象包含一个类型为曲面的对象。

读入音频并将其转换为单侧功率谱。

[audioIn, fs] = audioread (“NoisySpeech-16-22p5-mono-5secs.wav”);赢得=损害(圆(0.04 * fs),“周期”);noverlap =圆(0.02 * fs);fftLength = 1024;F (S, t) = stft (audioIn fs,...“窗口”,赢了,...“OverlapLength”noverlap,...“FFTLength”fftLength,...“FrequencyRange”“单向的”);PowerSpectrum = S *连词(年代);

设计一种基于erbb的听觉滤波器组。绘制滤波器组。

麻木=32;范围= [011025];归一化=“带宽”;(fb, cf) = designAuditoryFilterBank (fs,...“FrequencyScale”“博”...“FFTLength”fftLength,...“NumBands”,麻木,...“FrequencyRange”、范围、...“归一化”标准化);地块(F、fb.);网格标题(“ERB过滤器银行”)包含(“频率(赫兹)”

图中包含一个轴对象。标题为ERB Filter Bank的轴对象包含32个类型为line的对象。

要应用频域滤波,执行滤波器组和功率谱图的矩阵乘法。

X = fb * PowerSpectrum;

以dB为单位可视化每频带的功率。

XdB = 10 * log10 (X);冲浪(t, cf, XdB“EdgeColor”“没有”);包含(“时间(s)”) ylabel (“频率(赫兹)”, 90年)视图([0])标题(“ERB-Based谱图”)轴牢固的

图中包含一个轴对象。标题为“基于erbb的光谱图”的轴对象包含一个类型为曲面的对象。

输入参数

全部折叠

滤波器设计的采样率Hz,指定为一个正标量。

数据类型:|

名称-值参数

指定可选的逗号分隔的对名称,值参数。的名字参数名和价值为对应值。的名字必须出现在引号内。可以以任意顺序指定多个名称和值对参数名称1,值1,…,名称,值

例子:“FrequencyScale”、“梅尔”

用频率标度来设计听觉滤波器组,指定为逗号分隔对组成“FrequencyScale”“梅尔”“树皮”,或“博”

数据类型:字符|字符串

用于计算DFT的点数,指定为逗号分隔对组成“FFTLength”一个正整数。

数据类型:|

带通滤波器的个数,指定为逗号分隔对“麻木人”一个正整数。带通滤波器的缺省数目取决于频率标度

  • 如果频率标度设置为“树皮”“梅尔”,然后NumBands默认为32

  • 如果频率标度设置为“博”,然后NumBands默认为(即:hz2erb频响(2))-hz2erb频响(1)))

数据类型:|

以Hz为单位设计听觉滤波器组的频率范围,指定为逗号分隔对,由“FrequencyRange”以及在[0]范围内单调递增值的两元素行向量,fs/ 2)。

数据类型:|

用于滤波器组权重的归一化技术:

  • “带宽”——每个带通滤波器的权值由相应的滤波器带宽归一化。

  • “区域”——每个带通滤波器的权重由相应的带通滤波器面积归一化。

  • “没有”——过滤器的权重没有标准化。

数据类型:字符|字符串

设计一个单面或双面滤波器组,指定为逗号分隔对组成“单向的”,要么真正的

数据类型:逻辑

滤波器组设计的域,指定为逗号分隔对,由“FilterBankDesignDomain”,要么“线性”“扭曲的”.设置过滤器组设计域为“线性”设计线性(Hz)域中的带通滤波器。将过滤器组设计域设置为“扭曲的”设计弯曲(mel或Bark)域的带通滤波器。

依赖关系

此参数仅适用于以下情况:频率标度设置为“梅尔”(默认)或“树皮”

数据类型:字符|字符串

输出参数

全部折叠

听觉滤波器组,返回为——- - - - - -N矩阵,在哪里为频带数(NumBands),N为单侧频谱的频率点数((即:FFTLength/ 2)).

数据类型:

带通滤波器的中心频率,以Hz为单位,返回为带有的行向量NumBands元素。

数据类型:

带通滤波器的带宽(Hz),返回为带有的行向量NumBands元素。

数据类型:

算法

梅尔滤波器组被设计成在梅尔尺度上等距的半重叠三角形。[1]

巴克滤波器组被设计成在巴克尺度上等距的半重叠三角形。[2]

ERB滤波器组设计为伽玛通滤波器[4]其中心频率在ERB尺度上是等间距的。[3]

兼容性的考虑

全部展开

行为在R2020b中改变

工具书类

[1] O 'Shaghnessy,道格拉斯。语音通信:人与机器.马萨诸塞州阅读:Addison-Wesley出版公司,1987年。

[2] Traunmuller,公司董事长。“紧张性感觉量表的分析表达式”。美国声学学会杂志.1990年第1期第88卷,第97-100页。

Brian R. Glasberg和Brian C. J. Moore。"从缺口噪声数据推导听觉滤波器形状"听力的研究. 第47卷,1990年第1-2期,第103-138页。

[4]斯兰尼马尔科姆。“帕特森-霍尔德沃斯听觉滤波器组的有效实现”。苹果电脑技术报告35,1993。

扩展功能

C / c++代码生成
使用MATLAB®Coder™生成C和c++代码。

介绍了R2019b