主要内容gydF4y2Ba

非平稳Gabor坐标系和常q变换gydF4y2Ba

非平稳Gabor帧使您能够实现信号的时间自适应或频率自适应分析。的函数gydF4y2BacqtgydF4y2Ba而且gydF4y2BaicqtgydF4y2Ba使用非平稳Gabor帧来获得信号的常数q(频率自适应)变换(CQT)。非平稳Gabor框架的一个显著优点是,它们能够构造稳定的逆,产生完美的重建。gydF4y2Ba

非平稳Gabor框架理论及其实现的有效算法是由于Dörfler, Holighaus, Grill和VelascogydF4y2Ba[1]gydF4y2Ba[2]gydF4y2Ba.算法gydF4y2Ba[1]gydF4y2Ba而且gydF4y2Ba[2]gydF4y2Ba实现CQT的锁相版本,它不会保留与naïve卷积获得的相同的相位。在gydF4y2Ba[3]gydF4y2Ba, Schörkhuber, Klapuri, Holighaus和Dörfler为CQT和逆CQT开发了有效的算法,模拟了naïve卷积获得的系数。大型时频分析工具箱gydF4y2Ba[4]gydF4y2Ba为非平稳Gabor分析和合成提供了一套广泛的算法。gydF4y2Ba

在标准的Gabor分析中,固定大小的窗口将时频平面平铺。非平稳Gabor框架是用于平铺时频平面的各种大小的窗函数的集合。小波分析以类似的方式对时频平面进行平铺。你可以在时间或频率上灵活地改变采样密度。非平稳Gabor帧在音频信号处理等领域很有用,其中固定大小的时频窗口不是最佳的。与短时间傅里叶变换不同,常q变换中使用的窗口具有可适应的带宽和采样密度。在频率空间中,窗口以对数间隔的中心频率为中心。gydF4y2Ba

分解时频平面gydF4y2Ba

的傅里叶变换gydF4y2Baf (t)gydF4y2Ba的相关性gydF4y2Baf (t)gydF4y2Ba与gydF4y2BaegydF4y2BaJ ω tgydF4y2Ba:gydF4y2Ba

FgydF4y2Ba (gydF4y2Ba ωgydF4y2Ba )gydF4y2Ba =gydF4y2Ba ∫gydF4y2Ba −gydF4y2Ba ∞gydF4y2Ba ∞gydF4y2Ba fgydF4y2Ba (gydF4y2Ba tgydF4y2Ba )gydF4y2Ba egydF4y2Ba −gydF4y2Ba jgydF4y2Ba ωgydF4y2Ba tgydF4y2Ba dgydF4y2Ba tgydF4y2Ba .gydF4y2Ba

自gydF4y2BaegydF4y2BaJ ω tgydF4y2Ba由于傅里叶变换没有紧支持,因此它不是研究非平万博1manbetx稳信号的理想选择。如果信号的频率含量随时间变化,傅里叶变换不会捕捉到这些变化是什么或什么时候发生的变化。这个时频平面的划分代表了傅里叶变换的行为。gydF4y2Ba

要对非平稳信号进行时频分析,从一个实值偶窗函数开始,gydF4y2Ba ggydF4y2Ba (gydF4y2Ba tgydF4y2Ba )gydF4y2Ba ,它仅在有限区间上有效非零,且范数等于1。另外,的傅里叶变换gydF4y2Ba ggydF4y2Ba (gydF4y2Ba tgydF4y2Ba )gydF4y2Ba 以0为中心,是低通的。接下来,窗口gydF4y2Baf (t)gydF4y2Ba有翻译gydF4y2Ba ggydF4y2Ba (gydF4y2Ba tgydF4y2Ba )gydF4y2Ba .然后对结果进行傅里叶变换gydF4y2Ba

年代gydF4y2Ba FgydF4y2Ba (gydF4y2Ba ugydF4y2Ba ,gydF4y2Ba ζgydF4y2Ba )gydF4y2Ba =gydF4y2Ba ∫gydF4y2Ba fgydF4y2Ba (gydF4y2Ba tgydF4y2Ba )gydF4y2Ba ggydF4y2Ba (gydF4y2Ba tgydF4y2Ba −gydF4y2Ba ugydF4y2Ba )gydF4y2Ba egydF4y2Ba −gydF4y2Ba jgydF4y2Ba ζgydF4y2Ba tgydF4y2Ba dgydF4y2Ba tgydF4y2Ba .gydF4y2Ba

关联gydF4y2Baf (t)gydF4y2BaGabor原子,gydF4y2Ba ggydF4y2Ba (gydF4y2Ba tgydF4y2Ba −gydF4y2Ba ugydF4y2Ba )gydF4y2Ba egydF4y2Ba jgydF4y2Ba ζgydF4y2Ba tgydF4y2Ba ,为标准Gabor分析。通过改变gydF4y2BaugydF4y2Ba,你只考虑的价值gydF4y2Baf (t)gydF4y2Ba附近的时间gydF4y2BaugydF4y2Ba.的支持万博1manbetxgydF4y2Ba ggydF4y2Ba (gydF4y2Ba tgydF4y2Ba )gydF4y2Ba 决定邻近时间的大小gydF4y2BaugydF4y2Ba.的傅里叶变换gydF4y2Ba ggydF4y2Ba ugydF4y2Ba ,gydF4y2Ba ζgydF4y2Ba (gydF4y2Ba tgydF4y2Ba )gydF4y2Ba =gydF4y2Ba ggydF4y2Ba (gydF4y2Ba tgydF4y2Ba −gydF4y2Ba ugydF4y2Ba )gydF4y2Ba egydF4y2Ba ζgydF4y2Ba tgydF4y2Ba 的傅里叶变换是由ζ平移的gydF4y2Ba ggydF4y2Ba (gydF4y2Ba tgydF4y2Ba )gydF4y2Ba 并且由gydF4y2Ba

ggydF4y2Ba ^gydF4y2Ba ugydF4y2Ba ,gydF4y2Ba ζgydF4y2Ba (gydF4y2Ba ωgydF4y2Ba )gydF4y2Ba =gydF4y2Ba egydF4y2Ba −gydF4y2Ba (gydF4y2Ba ωgydF4y2Ba −gydF4y2Ba ζgydF4y2Ba )gydF4y2Ba ggydF4y2Ba ^gydF4y2Ba (gydF4y2Ba ωgydF4y2Ba −gydF4y2Ba ζgydF4y2Ba )gydF4y2Ba .gydF4y2Ba

能量的集中gydF4y2Ba ggydF4y2Ba ^gydF4y2Ba ugydF4y2Ba ,gydF4y2Ba ζgydF4y2Ba (gydF4y2Ba ωgydF4y2Ba )gydF4y2Ba 有差异gydF4y2BaσgydF4y2BaωgydF4y2Ba并且以ζ为中心。如果窗户,gydF4y2Ba ggydF4y2Ba ugydF4y2Ba ,gydF4y2Ba ζgydF4y2Ba (gydF4y2Ba tgydF4y2Ba )gydF4y2Ba =gydF4y2Ba ggydF4y2Ba (gydF4y2Ba tgydF4y2Ba −gydF4y2Ba ugydF4y2Ba )gydF4y2Ba egydF4y2Ba ζgydF4y2Ba tgydF4y2Ba ,在规则网格上的位移,位移窗口和的乘积的傅里叶变换gydF4y2Baf (t)gydF4y2Ba为短时傅里叶变换(STFT)。时频平面的STFT平铺可以表示为一个方框网格,每个方框的中心位于(gydF4y2BaugydF4y2Ba,gydF4y2BaζgydF4y2Ba):gydF4y2Ba

函数集gydF4y2Ba {gydF4y2Ba ggydF4y2Ba ugydF4y2Ba ,gydF4y2Ba ζgydF4y2Ba }gydF4y2Ba 被称为gydF4y2Ba伽柏框架gydF4y2Ba.这个集合中的元素被称为gydF4y2Ba伽柏原子gydF4y2Ba.一个框架是一组函数,gydF4y2Ba{hgydF4y2BakgydF4y2Ba(t)}gydF4y2Ba,满足以下条件:存在常数gydF4y2Ba0 < a≤b <∞gydF4y2Ba对于任何函数gydF4y2Baf (t)gydF4y2Ba,gydF4y2Ba

一个gydF4y2Ba 为gydF4y2Ba fgydF4y2Ba 为gydF4y2Ba 2gydF4y2Ba ≤gydF4y2Ba ΣgydF4y2Ba kgydF4y2Ba |gydF4y2Ba 〈gydF4y2Ba fgydF4y2Ba ,gydF4y2Ba hgydF4y2Ba kgydF4y2Ba 〉gydF4y2Ba |gydF4y2Ba 2gydF4y2Ba ≤gydF4y2Ba BgydF4y2Ba 为gydF4y2Ba fgydF4y2Ba 为gydF4y2Ba 2gydF4y2Ba .gydF4y2Ba

能量的集中gydF4y2Ba ggydF4y2Ba (gydF4y2Ba tgydF4y2Ba )gydF4y2Ba ,在时间上,有方差gydF4y2BaσgydF4y2BatgydF4y2Ba.能量的集中gydF4y2Ba ggydF4y2Ba ^gydF4y2Ba (gydF4y2Ba ωgydF4y2Ba )gydF4y2Ba ,在频率上,有方差gydF4y2BaσgydF4y2BaωgydF4y2Ba.能量集中决定了窗口在时间和频率上定位信号的好坏。根据时频不确定性原理,在时域和频域同时进行定位是有限制的,如所示gydF4y2Ba

σgydF4y2Ba tgydF4y2Ba σgydF4y2Ba ωgydF4y2Ba ≥gydF4y2Ba 1gydF4y2Ba 2gydF4y2Ba .gydF4y2Ba

缩小一个域中的窗口会导致另一个域中的本地化效果较差。Gabor展示了窗口的面积是最小的gydF4y2Ba ggydF4y2Ba (gydF4y2Ba tgydF4y2Ba )gydF4y2Ba 是高斯。gydF4y2Ba

常q变换gydF4y2Ba

在CQT中,频率上的带宽和采样密度是变化的。窗口直接构造并应用于频域。不同的窗口有不同的中心频率和带宽,但中心频率与带宽的比值保持不变。保持恒定的比率意味着:gydF4y2Ba

  • 频率越高,时间分辨率越高。gydF4y2Ba

  • 频率分辨率在较低的频率下提高。gydF4y2Ba

由于不确定原理,每个窗口的时移取决于带宽。gydF4y2Ba

CQT取决于:gydF4y2Ba

  • 窗口函数gydF4y2BaggydF4y2BakgydF4y2Ba都是实数偶函数。在频域中,的傅里叶变换gydF4y2BaggydF4y2BakgydF4y2Ba在区间上定义,gydF4y2Ba(- f / 2, Fs / 2)gydF4y2Ba.gydF4y2Ba

  • 采样速率,ζgydF4y2Ba年代gydF4y2Ba.gydF4y2Ba

  • 每八度音阶的箱数,gydF4y2BabgydF4y2Ba.gydF4y2Ba

  • 最小和最大频率,ζgydF4y2Ba最小值gydF4y2Ba和ζgydF4y2Ba马克斯gydF4y2Ba.gydF4y2Ba

选择最小频率ζgydF4y2Ba最小值gydF4y2Ba以及每八度音阶的箱数gydF4y2BabgydF4y2Ba.接下来,形成一个几何间隔的频率序列,gydF4y2Ba

ζgydF4y2BakgydF4y2Ba=ζgydF4y2Ba最小值gydF4y2Ba×2gydF4y2BakgydF4y2Ba/gydF4y2BabgydF4y2Ba

为gydF4y2Bak = 0,…,kgydF4y2Ba在哪里gydF4y2BaKgydF4y2Ba一个整数是否满足ζgydF4y2BaKgydF4y2Ba最大频率严格小于奈奎斯特频率吗gydF4y2BaζgydF4y2Ba年代gydF4y2Ba/ 2gydF4y2Ba.的带宽gydF4y2BakgydF4y2BaTh频率设置为gydF4y2BaΩgydF4y2BakgydF4y2Ba=ζgydF4y2BakgydF4y2Ba+1gydF4y2Ba- - - - - -ζgydF4y2BakgydF4y2Ba-1gydF4y2Ba.给定这个抽样,比例gydF4y2BakgydF4y2Ba中心频率与窗口带宽无关gydF4y2BakgydF4y2Ba:gydF4y2Ba

Q = ζgydF4y2BakgydF4y2Ba/ΔgydF4y2BakgydF4y2Ba= (2gydF4y2Ba1 /gydF4y2BabgydF4y2Ba-2gydF4y2Ba1 /gydF4y2BabgydF4y2Ba)gydF4y2Ba-1gydF4y2Ba.gydF4y2Ba

为了保证完美的重构,分别在序列前加上直流分量和奈奎斯特频率。gydF4y2Ba

WgydF4y2Ba(ω)gydF4y2Ba窗体函数gydF4y2BaggydF4y2BakgydF4y2Ba.gydF4y2BaWgydF4y2Ba(ω)gydF4y2Ba一个以0为中心的实值连续函数在区间内是正的吗gydF4y2Ba(——½½)gydF4y2Ba,其他地方为0。gydF4y2BaWgydF4y2Ba(ω)gydF4y2Ba平移到每个中心频率ζgydF4y2BakgydF4y2Ba然后按比例缩小的。评估一个缩放和翻译的版本gydF4y2BaWgydF4y2Ba(ω)gydF4y2Ba产生滤波器系数gydF4y2BaggydF4y2BakgydF4y2Ba[gydF4y2Ba米gydF4y2Ba]gydF4y2Ba,由gydF4y2Ba

ggydF4y2BakgydF4y2Ba[gydF4y2Ba米gydF4y2Ba] =gydF4y2BaWgydF4y2Ba((gydF4y2Ba米gydF4y2BaζgydF4y2Ba年代gydF4y2Ba/gydF4y2BalgydF4y2Ba- - - - - -ζgydF4y2BakgydF4y2Ba) /ΩgydF4y2BakgydF4y2Ba)gydF4y2Ba

为gydF4y2Bam = 0,…,L-1gydF4y2Ba,在那里gydF4y2BalgydF4y2Ba是信号长度。默认情况下,gydF4y2BacqtgydF4y2Ba使用gydF4y2Ba“损害”gydF4y2Ba窗口。gydF4y2Ba

根据不确定原理,带宽的大小限制时移的值。为了满足坐标系不等式,平移gydF4y2Ba一个gydF4y2BakgydF4y2Ba的gydF4y2BaggydF4y2BakgydF4y2Ba必须满足gydF4y2Ba

一个gydF4y2BakgydF4y2Ba≤ζgydF4y2BakgydF4y2Ba/ΩgydF4y2BakgydF4y2Ba.gydF4y2Ba

如前所述,窗口应用于频域。的过滤器,gydF4y2BaggydF4y2BakgydF4y2Ba,中心为gydF4y2BaζgydF4y2BakgydF4y2Ba,形成并应用于信号的傅里叶变换。求反变换得到常数q系数。gydF4y2Ba

参考文献gydF4y2Ba

[1] Holighaus, N., M. Dörfler, G.A. Velasco和T. Grill。“可逆实时常数q变换的框架。”gydF4y2BaIEEE音频、语音和语言处理汇刊gydF4y2Ba.Vol. 21 No. 4, 2013, pp. 775-785。gydF4y2Ba

[2]贝拉斯科,G. A., N.霍利豪斯,M. Dörfler, T.格尔。用非平稳Gabor坐标系构造可逆常数- q变换在gydF4y2Ba第十四届数字音频效果国际会议论文集(DAFx-11)gydF4y2Ba.法国巴黎:2011年。gydF4y2Ba

[3] Schörkhuber, C., A. Klapuri, N. Holighaus和M. Dörfler。“一个Matlab工具箱的有效完美重建时频变换与对数频率分辨率。”提交至gydF4y2BaAES第53届语义音频国际会议gydF4y2Ba.英国伦敦:2014年。gydF4y2Ba

[4] prolesa, Z., P. L. Søndergaard, N. Holighaus, C. Wiesmeyr和P. Balazs。gydF4y2Ba大型时频分析工具箱2.0gydF4y2Ba.声音,音乐和运动,计算机科学2014年讲座笔记,第419-442页。gydF4y2Bahttps://github.com/ltfatgydF4y2Ba

另请参阅gydF4y2Ba

|gydF4y2Ba

相关的话题gydF4y2Ba