主要内容

使用深度学习的音频处理

使用音频和语音处理应用程序扩展深度学习工作流程

通过使用深度学习工具箱™和音频工具箱™,将深度学习应用于音频和语音处理应用程序。有关信号处理应用,请参见使用深度学习的信号处理.有关无线通信中的应用,请参见使用深度学习的无线通信

应用程序

音频贴标签机 定义并可视化基本事实标签

功能

全部展开

audioDatastore 用于收集音频文件的数据存储
audioDataAugmenter 增强音频数据
audioFeatureExtractor 流线音频特征提取
ivectorSystem 创建i矢量系统
openl3Features 提取OpenL3特性
pitchnn 用深度学习神经网络估计音高
vggishFeatures 提取VGGish特征
classifySound 对音频信号中的声音进行分类
CREPE神经网络
crepePreprocess CREPE深度学习网络音频预处理
crepePostprocess CREPE深度学习网络的后处理输出
openl3 OpenL3神经网络
openl3Features 提取OpenL3特性
openl3Preprocess 对OpenL3特征提取音频进行预处理
pitchnn 用深度学习神经网络估计音高
vggish VGGish神经网络
vggishFeatures 提取VGGish特征
vggishPreprocess VGGish特征提取音频预处理
yamnet YAMNet神经网络
yamnetGraph YAMNet AudioSet本体图
yamnetPreprocess 对YAMNet分类音频进行预处理

主题

音频应用的深度学习简介(音频工具箱)

了解将深度学习应用于音频应用的常用工具和工作流程。

使用深度学习分类声音(音频工具箱)

训练、验证和测试简单的长短期记忆(LSTM)来分类声音。

预训练音频网络的迁移学习

使用迁移学习重新训练YAMNet,一个预训练的卷积神经网络(CNN),以分类一组新的音频信号。

使用自定义SincNet层和深度学习的说话人识别

使用自定义深度学习层执行语音识别,该层实现了mel规模的滤波器组。

使用深度学习网络消除语音干扰

训练一个深度学习模型,消除语音中的混响。

Simulink中的语音指令识别万博1manbetx

使用Simulink检测音频中语音命令的存在万博1manbetx®模型。

基于小波散射和深度学习的语音数字识别

这个例子展示了如何使用机器和深度学习技术对语音数字进行分类。

利用深度学习网络分离鸡尾酒会信息源

这个例子展示了如何使用深度学习网络隔离语音信号。

音频特征的顺序特征选择

本例给出了应用于语音数字识别任务的特征选择的典型工作流程。

学习使用深度学习的预强调过滤器

使用卷积深度网络学习语音识别的预强调滤波器。

特色的例子