Audio Processing Using Deep Learning
Apply deep learning to audio and speech processing applications by using Deep Learning Toolbox™ together with Audio Toolbox™. For signal processing applications, seeSignal Processing Using Deep Learning。For applications in wireless communications, see使用深度学习的无线通信。
应用
信号标签 | Label signal attributes, regions, and points of interest, and extract features |
功能
Blocks
VGGish | VGGish embeddings extraction network |
vggish嵌入 | 提取vggish嵌入 |
Yamnet | Yamnetsound classification network |
Sound Classifier | Classify sounds in audio signal |
话题
- 音频应用深度学习简介(音频工具箱)
学习常见的工具和工作流程,将深度学习应用于音频应用程序。
- 使用深度学习对声音进行分类(音频工具箱)
训练,验证和测试简单的长期记忆(LSTM)以对声音进行分类。
- Transfer Learning with Pretrained Audio Networks in Deep Network Designer
此示例显示了如何使用深层网络设计器进行验证的网络进行交互微调以对新的音频信号进行分类。
- Speaker Identification Using Custom SincNet Layer and Deep Learning
Perform speech recognition using a custom deep learning layer that implements a mel-scale filter bank.
- Dereverberate Speech Using Deep Learning Networks
训练一个深度学习模型,从语音中消除混响。
- Speech Command Recognition in Simulink
Detect the presence of speech commands in audio using a Simulink®模型。
- 音频功能的顺序功能选择
This example shows a typical workflow for feature selection applied to the task of spoken digit recognition.
- Train Spoken Digit Recognition Network Using Out-of-Memory Audio Data
此示例使用转换后的数据存储台上训练在不可存储的音频数据上的口语识别网络。
- 火车口语数字识别网络使用不可存储的功能
该示例使用转换后的数据存储器在失调的听觉谱图上训练一个口头数字识别网络。
- 使用深度学习能力技术调查音频分类
此示例显示了如何使用可解释性技术来研究经过对音频数据进行分类的深神经网络的预测。