机器学习和深度学习的音频

数据集管理,标记和扩增;分割和音频,语音特征提取和声学应用

音频工具箱™提供的功能来开发音频,语音,并使用机器学习和深入学习声学应用。采用audioDatastore管理和加载大型数据集。采用音频贴标机交互定义和可视化地面实况。采用audioDataAugmenter使用音频专用增量技术放大的数据集。采用audioFeatureExtractor打造高效的模块化特征提取管线。

应用

音频贴标机 定义和可视化地面实况标签

现场编辑任务

提取音频功能 在实时编辑器简化音频特征提取

功能

展开全部

audioDatastore 数据存储的音频文件集合
MFCC 提取MFCC,数能量,DELTA和delta-Δ音频信号
GTCC 伽马通提取倒谱系数,数的能量,DELTA和delta-Δ
cepstralFeatureExtractor 提取音频段倒谱特征
audioDataAugmenter 增强的音频数据
audioTimeScaler 申请时间缩放音频流
shiftPitch 移音频程度
stretchAudio 时间拉伸音频
erb2hz 从等效矩形带宽(ERB)刻度赫兹转换
bark2hz 从巴克尺度转换为赫兹
mel2hz 从梅尔规模赫兹转换
hz2erb 从赫兹转换为等效矩形带宽(ERB)刻度
hz2bark 从赫兹转换为巴克标
hz2mel 从赫兹转换为美度
phon2sone 从响度单位到宋转换
sone2phon 从宋到响度单位转换
designAuditoryFilterBank 设计听觉滤波器组
integratedLoudness 测量集成响度和响度范围
loudnessMeter 符合标准的响度测量
harmonicRatio 谐波比
沥青 估计音频信号的基频
detectSpeech 检测语音的边界在音频信号
voiceActivityDetector 检测音频信号的语音存在
audioFeatureExtractor 简化音频特征提取
spectralCentroid 频谱质心为音频信号和听觉谱图
spectralCrest 光谱波峰的音频信号和听觉谱图
spectralDecrease 音频信号和听觉频谱频谱下降
spectralEntropy 谱熵的音频信号和听觉谱图
spectralFlatness 频谱平坦度为音频信号和听觉谱图
spectralFlux 音频信号和听觉谱图光谱通量
spectralKurtosis 光谱峰度音频信号和听觉谱图
spectralRolloffPoint 频谱滚降点,音频信号和听觉谱图
spectralSkewness 谱偏斜的音频信号和听觉谱图
spectralSlope 音频信号和听觉频谱频谱斜率
spectralSpread 频谱扩展的音频信号和听觉谱图
melSpectrogram 梅尔频谱
kbdwin 凯泽 - 贝塞尔派生窗
MDCT 改进离散余弦变换
IMDCT 逆改进离散余弦变换

语音活动检测器 检测音频信号的语音存在
倒谱特征提取 提取音频段倒谱特征
响度测量仪 符合标准的响度测量

主题

标签音频使用音频贴标机

交互定义和可视化地面实况标签音频数据集。

语音到文本转

请在MATLAB语音到文本转®使用第三方基于云的API。

文本到语音转换

使用第三方基于云的API执行在MATLAB文本到语音转换。

谱描述符

概述和光谱描述的应用。

精选示例