音频工具箱
设计和分析语音、声学和音频处理系统
音频工具箱™ 提供用于音频处理、语音分析和声学测量的工具。它包括处理音频信号(如均衡和时间拉伸)的算法,估计声音信号指标(如响度和清晰度)的算法,以及提取音频特征(如MFCC和基音)的算法。它还提供先进的机器学习模型,包括i-vectors,以及预训练的深度学习网络,包括VGGish和CREPE。工具箱应用程序支持实时算法测试、脉冲响应测量和信号标记。工具箱提供ASIO、CoreAudio和其他声卡的流接口;MIDI设备;以及用于生成和托管VST和音频单元插件的工具。万博1manbetx
使用Audio Toolbox,您可以导入、标记和扩充音频数据集,以及提取特征以训练机器学习和深度学习模型。提供的预训练模型可应用于音频录制,以进行高级语义分析。
您可以实时制作音频处理算法的原型,或者通过将低延迟音频流到声卡或从声卡流出来运行自定义声学测量。您可以将算法转换为音频插件,以在外部主机应用程序(如数字音频工作站)中运行,从而验证算法。插件托管允许您使用外部音频插件作为常规音频®对象。
开始:
连接到标准音频驱动程序
使用标准音频驱动程序(如ASIO, WASAPI, CoreAudio和ALSA)跨Windows从声卡(如USB或Thunderbolt™)读写音频样本®,Mac®,以及Linux®操作系统。
预先训练的深度学习模型
使用深度学习执行复杂的信号处理任务,并用一行代码提取音频嵌入。访问已建立的预先训练的网络,如YAMNet、VGGish、CREPE和OpenL3,并借助预配置的特征提取功能应用它们。
音频、语音和声学的特征提取
将信号转换成时频表征,如Mel、Bark和ERB谱图。计算倒谱系数,如MFCC和GTCC,以及标量特征,如音调、谐波和谱描述符。使用预先训练的深度学习模型(VGGish, OpenL3)和i-向量系统提取高级特征和信号嵌入。加速特征提取与兼容的GPU卡。
机器学习模型和训练方法
用您的音频数据集训练最先进的机器学习。使用已建立的模型系统,如i-vector,用于发言者识别和验证等应用程序。从工作示例中学习如何设计和训练音频、语音和声学应用的高级神经网络和层。
导入、注释和预处理音频数据集
读取、分区和预处理大量音频记录集合。用应用程序手动标注音频信号。使用预先训练的机器学习模型自动识别和分割感兴趣的区域。
用方框图进行系统仿真
使用Simulink的音频处理模块库设计和模拟系统模型万博1manbetx®.使用交互式控件和动态绘图调整参数并可视化系统行为。
用于参数控制和消息交换的MIDI连接
利用MIDI控制曲面交互改变MATLAB算法的参数。通过发送和接收任何类型的MIDI消息来控制外部硬件或响应事件。
基于标准的计量和分析
将声压级(SPL)计和响度计应用于录制或现场信号。使用倍频程和分数倍频程滤波器分析信号。对原始记录应用符合标准的A、C或K加权过滤器。测量声学锐度、粗糙度和波动强度。
脉冲响应测量
用最大长度序列(MLS)和指数扫频正弦波(ESS)测量声学和音频系统的脉冲和频率响应。开始使用脉冲响应测量器应用程序。通过编程生成激励信号和估计系统响应,实现测量自动化。
生成音频插件
直接从MATLAB代码生成VST插件、AU插件和独立可执行插件,无需手动设计用户界面。对于更高级的插件原型,生成准备好的JuSE C++项目(需要MATLAB编码器)™).
托管外部音频插件
使用外部VST和AU插件作为常规MATLAB对象。更改插件参数并以编程方式处理MATLAB数组。或者,自动将插件参数与用户界面和MIDI控件关联。托管从MATLAB代码生成的插件,以提高执行效率。
CPU和GPU目标的代码生成
与MathWorks®编码器产品,s manbetx 845从信号处理和机器学习算法生成C和C++源代码,作为工具箱函数、对象和块提供。从选择的特征提取函数生成CUDA源代码,如mfcc
和光谱图
.
低成本和移动设备
基于树莓Pi的原型音频处理设计™ 通过使用车载或外部多声道音频接口。创建交互式控制面板作为Android的移动应用程序®或iOS设备。
零延迟系统
具有单样本输入和输出的原型音频处理设计,用于自适应噪声控制、助听器验证或其他需要最小往返DSP延迟的应用程序。自动目标Speedgoat音频机和ST发现板直接从Simulink模型。万博1manbetx