文档帮助中心文档
窗长
梅尔谱图
S=频谱图(音频输入,fs)
S=频谱图(音频输入、fs、名称、值)
[S,F,T]=光谱图(___)
光谱图(___)
实例
s=光谱图(音频素,财政司司长)以采样率返回音频输入的mel频谱图财政司司长。该函数将输入列视为单个通道。
s=光谱图(音频素,财政司司长)
s
音频素
财政司司长
s=光谱图(音频素,财政司司长,名称、值)指定使用一个或多个选项的选项名称、值对参数。
s=光谱图(音频素,财政司司长,名称、值)
名称、值
[s,F,T]=光谱图(___)以Hz为单位返回频带的中心频率,以秒为单位返回每个数据窗口的位置。该位置对应于每个窗口的中心。您可以将此输出语法与以前的任何输入语法一起使用。
[s,F,T]=光谱图(___)
F
T
光谱图(___)在当前图形的曲面上绘制mel光谱图。
全部崩溃
使用默认设置计算整个音频文件的mel频谱图。打印滤波器组中带通滤波器的数量和mel频谱图中的帧数。
[audioIn,fs]=音频读取(“计数-16-44p1-mono-15秒波形”);S = melSpectrogram (audioIn fs);[numBands, numFrames] = (S)大小;fprintf(“滤波器组中的带通滤波器数量:%d\n”numBands)
滤波器组中的带通滤波器数量:32
fprintf(“光谱图中的帧数:%d\n”,numFrames)
频谱图中的帧数:1551
绘制mel谱图。
melSpectrogram (audioIn fs)
计算具有1024点重叠的2048点周期Hann窗的mel谱。转换到频率域使用4096点FFT。将频域表示法通过64个跨越62.5 Hz至8khz的半重叠三角形带通滤波器。
[audioIn,fs]=音频读取(“FunkyDrums-44p1-stereo-25secs.mp3”);S=频谱图(音频输入,fs,...“窗口”,hann(2048,“周期性”),...“重叠长度”,1024,...“FFTLength”,4096,...“NumBands”,64,...“FrequencyRange”,[62.5,8e3]);
呼叫光谱图同样,这一次没有输出参数,因此您可以可视化mel频谱图。输入音频是多通道信号。如果您调用光谱图使用多通道输入且无输出参数时,仅打印第一个通道。
光谱图
melSpectrogram (audioIn fs,...“窗口”,hann(2048,“周期性”),...“重叠长度”,1024,...“FFTLength”,4096,...“NumBands”,64,...“FrequencyRange”,[62.5,8e3])
光谱图将频域滤波器组应用于在时间上加窗的音频信号。您可以获得过滤器的中心频率和与分析窗口相对应的时间瞬间作为第二个和第三个输出参数光谱图.
获取多声道音频信号的mel频谱图、滤波器组中心频率和分析窗口时间瞬间。使用中心频率和时间瞬间绘制每个声道的mel频谱图。
[audioIn,fs]=音频读取(“AudioArray-16-16-4声道-20sec.wav”);[S,cF,t]=melSpectrogram(audioIn,fs);S=10*log10(S+eps);%转换为dB进行绘图对于i=1:尺寸(S,3)图(i)表面(t,cF,S(:,:,i),“EdgeColor”,“没有”);xlabel(‘时间’)伊拉贝尔(‘频率(Hz)’)视图([0,90])标题(sprintf('频道%d'轴([t(1)t(end)cF(1)cF(end)])终止
音频输入,指定为列向量或矩阵。如果指定为矩阵,则函数将列视为独立的音频通道。
数据类型:仅有一个的|双重的
仅有一个的
双重的
以Hz为单位的输入采样率,指定为正标量。
指定可选的逗号分隔的字符对名称、值参数。名称是参数名和价值是对应的值。名称必须出现在引号内。您可以按任意顺序指定多个名称和值对参数,如下所示:Name1, Value1,…,的家.
名称
价值
Name1, Value1,…,的家
“窗口长度”,1024
窗
汉明(圆(fs * 0.3),“周期性”)
在时域应用的窗口,指定为逗号分隔的对,由“窗口”和一个实向量。向量中的元素数必须在[1,大小(音频素, 1)]。向量中的元素数也必须大于OverlapLength.
“窗口”
大小(音频素, 1)
OverlapLength
圆形(0.02*财政司司长)
[0, (窗长- 1)]
样本中的分析窗口重叠长度,指定为逗号分隔对,由“重叠长度”和范围内的整数[0, (窗长- 1)].
“重叠长度”
FFT长度
用于计算DFT的点数,指定为逗号分隔对,由“FFTLength”和大于或等于的正整数窗长如果unspecified,FFT长度默认为窗长.
“FFTLength”
麻木
32
mel带通滤波器的数量,指定为逗号分隔对,由“NumBands”一个正整数。
“NumBands”
FrequencyRange
[0财政司司长/2]
以Hz计算mel谱图的频率范围,指定为逗号分隔对,由“FrequencyRange”以及在该范围内单调递增值的两元素行向量[0,财政司司长/2].
“FrequencyRange”
[0,财政司司长/2]
谱型
“权力”
“震级”
mel谱图的类型,指定为逗号分隔对,包括“光谱类型”和“权力”或“震级”.
“光谱类型”
数据类型:字符|一串
字符
一串
窗口规范化
符合事实的
错误的
应用窗口规范化,指定为逗号分隔对,由“窗口规范化”和符合事实的或错误的什么时候窗口规范化被设置为符合事实的,对mel谱图中的功率(或幅度)进行归一化,以去除时域的功率(或幅度)窗.
“窗口规范化”
滤波器组归一化
“带宽”
“区域”
“没有”
筛选器组规范化的类型,指定为逗号分隔对,由“过滤器组规范化”和“带宽”,“区域”或“没有”.
“过滤器组规范化”
Mel谱图,以列向量、矩阵或三维数组的形式返回s是L——- - - - - -M——- - - - - -N,其中:
L是每个mel频谱中的频率箱数。麻木和财政司司长决定L.
M是音频信号被分割成的帧数。大小(音频素, 1),窗长和OverlapLength决定M.
N频道的数量是否为N=大小(音频素, 2).
大小(音频素, 2)
将从输出中删除尾随的单例维度s.
mel带通滤波器的中心频率,以Hz为单位,以长度作为行向量返回大小(s, 1).
大小(s, 1)
以秒为单位的每个音频分析窗口的位置,作为行向量长度返回大小(s, 2)。该位置对应于每个窗口的中心。
大小(s, 2)
这个光谱图函数遵循通用算法计算mel谱图,如中所述[1].
在该算法中,音频输入首先被缓冲到音频帧中努梅尔(窗)样本数。帧由OverlapLength样本数。指定的窗应用于每个帧,然后使用FFT长度点数。频域表示可以是幅值或功率,由谱型如果窗口规范化被设置为符合事实的,通过窗口对光谱进行归一化。频域表示的每一帧都通过mel滤波器组。对mel滤波器组输出的光谱值进行求和,然后将通道连接起来,以便将每个帧转换为麻木-元素列向量。
努梅尔(窗)
mel滤波器组设计为在mel尺度上等距分布的半重叠三角形滤波器。麻木控制mel带通滤波器的数量。FrequencyRange控制MEL滤波器组中第一个和最后一个滤波器的带边。滤波器组归一化指定应用于单个波段的规范化类型。
全部展开
未来版本中的行为改变
这个窗长参数将从中删除光谱图函数。使用窗而不是参数。
在R2020b之前的版本中,您只能指定时域窗口的长度。该窗口始终设计为周期性汉明窗口。您可以替换代码实例
S=频谱图(音频输入,fs,“WindowLength”,1024);
S=频谱图(音频输入,fs,“窗口”,哈明(1024,“周期性”));
[1] 拉比纳、劳伦斯R.和罗纳德W.谢弗。数字语音处理的理论与应用. 新泽西州上鞍河:皮尔森,2010年。
光谱图|mfcc|gtcc|mdct|audioFeatureExtractor
mfcc
gtcc
mdct
audioFeatureExtractor
您有此示例的修改版本。是否要用您的编辑打开此示例?
您单击了与此MATLAB命令对应的链接:
通过在MATLAB命令窗口中输入命令来运行该命令。Web浏览器不支持MATLAB命令。万博1manbetx
选择一个网站以获取可用的翻译内容,并查看本地活动和优惠。根据您的位置,我们建议您选择:.
您还可以从以下列表中选择网站:
选择中国站点(中文或英文)以获得最佳站点性能。其他MathWorks国家/地区站点不适合您所在位置的访问。
联系当地办事处
现在受审