主要内容

特征提取

梅尔谱图,MFCC,音高,谱描述符

从音频信号中提取特征,用作机器学习或深度学习系统的输入。使用单独的函数,例如melSpectrogrammfcc球场,spectralCentroid,或使用audioFeatureExtractor对象来创建最小化冗余计算的特征提取管道。在实时脚本中,使用提取音频特征以图形方式选择要提取的特征。

对象

audioFeatureExtractor 流线音频特征提取
ivectorSystem 创建i矢量系统

实时编辑任务

提取音频特征 精简音频特征提取在现场编辑器

功能

全部展开

audioDelta 计算特征
designAuditoryFilterBank 设计听觉滤波器组
melSpectrogram 梅尔·光谱图
audioDelta 计算特征
cepstralCoefficients 提取倒谱系数
gtcc 提取伽马倒谱系数,对数能量,和-
mfcc 提取MFCC,记录音频信号的能量、delta和delta-delta
openl3Embeddings 提取OpenL3特性嵌入
vggishEmbeddings 提取VGGish特征嵌入
audioDelta 计算特征
harmonicRatio 谐波比率
球场 估计音频信号的基频
pitchnn 用深度学习神经网络估计音高
audioDelta 计算特征
spectralCentroid 音频信号和听觉谱图的谱心
spectralCrest 音频信号和听觉谱图的谱峰
spectralDecrease 音频信号和听觉谱图的谱下降
spectralEntropy 音频信号和听觉谱图的谱熵
spectralFlatness 音频信号和听觉谱图的谱平坦度
spectralFlux 音频信号和听觉谱图的谱通量
spectralKurtosis 音频信号和听觉谱图的谱峰度
spectralRolloffPoint 音频信号和听觉谱图的谱翻转点
spectralSkewness 音频信号和听觉谱图的谱偏度
spectralSlope 音频信号和听觉谱图的谱斜率
spectralSpread 音频信号和听觉谱图的谱扩展
erb2hz 将等效矩形带宽(ERB)刻度转换为赫兹
bark2hz 从树皮尺度转换为赫兹
mel2hz 从梅尔尺度转换为赫兹
hz2erb 将赫兹转换为等效矩形带宽(ERB)刻度
hz2bark 从赫兹转换为树皮尺度
hz2mel 将赫兹刻度转换为梅尔刻度
phon2sone 从phon转换为sone
sone2phon 从sone转换为phon

音频δ 计算特征
听觉谱图 从音频中提取mel, Bark或ERB谱图
Cepstral系数 从谱图中提取倒谱系数
设计听觉滤波器组 设计频域听觉滤波器组
设计Mel滤波器组 设计频域梅尔滤波器组
梅尔·光谱图 从音频中提取mel谱图
MFCC 从音频中提取梅尔频率倒谱系数

主题