主要内容

Pretrained网络

迁移学习,声音分类,特征嵌入

Audio Toolbox™提供预训练的VGGish和YAMNet网络。使用vggishyamnet在MATLAB函数®YAMNet在仿真软件万博1manbetx®直接与预先训练的网络交互。的classifySound函数在MATLAB和声音分类器在Simulink万博1manbetx中的块为YAMNet执行所需的预处理和后处理,以便您可以定位声音并将其分类到521个类别之一中。的声音分类器块相当于级联YAMNet预处理块和YAMNet块。方法探索YAMNet本体yamnetGraph函数。的vggishFeatures函数为VGGish执行必要的预处理和后处理,以便您可以提取特征嵌入输入到机器学习和深度学习系统。

这个功能需要深度学习工具箱™。

功能

全部展开

vggishFeatures 提取VGGish特性
vggish VGGish神经网络
vggishPreprocess 预处理音频进行VGGish特征提取
classifySound 在音频信号中分类声音
yamnet YAMNet神经网络
yamnetGraph YAMNet AudioSet本体图
yamnetPreprocess 预处理音频用于YAMNet分类
openl3 OpenL3神经网络
openl3Preprocess 预处理音频,用于OpenL3特征提取
openl3Features 提取OpenL3特性
绉神经网络
crepePreprocess 对CREPE深度学习网络进行音频预处理
crepePostprocess CREPE深度学习网络后处理输出
pitchnn 利用深度学习神经网络估计音高
ivectorSystem 创建矢量i系统
speakerRecognition 预训练的说话者识别系统

声音分类器 在音频信号中分类声音
YAMNet YAMNet声音分类网
YAMNet预处理 预处理音频用于YAMNet分类

特色的例子