主要内容

使用深度学习的音频处理

扩展深度学习工作流程与音频和语音处理应用程序

通过使用深度学习工具箱™和音频工具箱™,将深度学习应用于音频和语音处理应用。有关信号处理应用,请参阅利用深度学习进行信号处理.有关无线通讯的应用,请参阅使用深度学习的无线通信

应用程序

音频贴标签机 定义和可视化地面真相标签

功能

全部展开

audioDatastore 用于收集音频文件的数据存储
audioDataAugmenter 增加音频数据
audioFeatureExtractor 简化音频特征提取
ivectorSystem 创建矢量i系统
openl3Features 提取OpenL3特性
pitchnn 深度学习神经网络估计基音
vggishFeatures 提取VGGish特性
classifySound 对音频信号中的声音进行分类
绉神经网络
crepePreprocess CREPE深度学习网络的音频预处理
crepePostprocess CREPE深度学习网络的后处理输出
openl3 OpenL3神经网络
openl3Features 提取OpenL3特性
openl3Preprocess 预处理音频用于OpenL3特征提取
pitchnn 深度学习神经网络估计基音
vggish VGGish神经网络
vggishFeatures 提取VGGish特性
vggishPreprocess 预处理音频用于VGGish特征提取
yamnet YAMNet神经网络
yamnetGraph YAMNet AudioSet本体图
yamnetPreprocess 预处理音频,用于YAMNet分类

主题

音频应用深度学习简介(音频工具箱)

学习将深度学习应用于音频应用的常用工具和工作流程。

使用深度学习分类声音(音频工具箱)

训练、验证和测试一个简单的长短期记忆(LSTM)来分类声音。

通过预先训练的音频网络进行迁移学习

使用迁移学习来重新训练YAMNet,一个预先训练的卷积神经网络(CNN),对一组新的音频信号进行分类。

使用自定义自信网络层和深度学习识别说话人

使用自定义深度学习层进行语音识别,该层实现了梅尔尺度滤波器组。

使用深度学习网络消除语音干扰

训练一个深度学习模型,消除语音中的混响。

Simulink中的语音命令识别万博1manbetx

使用Simulink检测音频中语音命令的存在万博1manbetx®模型。

基于小波散射和深度学习的语音数字识别

这个例子展示了如何使用机器和深度学习技术对语音数字进行分类。

使用深度学习网络的鸡尾酒会源分离

这个例子展示了如何使用深度学习网络分离语音信号。

音频特征的顺序特征选择

这个例子展示了一个典型的语音数字识别特征选择的工作流程。

使用深度学习学习前置重点过滤器

使用卷积深度网络学习语音识别的预强调过滤器。

特色的例子