音频工具箱

设计和分析语音,声学和音频处理系统

Audio Toolbox™提供音频处理,语音分析和声学测量的工具。它包括用于处理音频信号的算法,例如均衡和时间拉伸,估计诸如响度和清晰度的声学信号度量,以及提取诸如MFCC和音调的音频特征。它还提供先进的机器学习模型,包括i-vectors,以及预先覆盖的深度学习网络,包括vgggish和crepe。工具箱应用支持实时算法测试万博1manbetx,脉冲响应测量和信号标记。该工具箱为Asio,Coreaudio和其他声卡提供流式界面;MIDI设备;和用于生成和托管VST和音频单元插件的工具。

使用Audio Toolbox您可以导入,标签和增强音频数据集,以及培训机器学习和深度学习模型的提取功能。提供的预先训练的型号可以应用于高级语义分析的音频录制。

您可以实时地建立音频处理算法的原型,或者通过流低延迟音频进出声卡来运行自定义的声学测量。您可以将算法转换为一个音频插件,以便在Digital audio workstation等外部主机应用程序中运行,从而验证算法。插件托管允许您使用外部音频插件作为常规MATLAB®对象。

开始:

使用音频接口流获取和播放

连接到标准笔记本电脑和桌面声卡,用于在文件和实时输入和输出的任何组合之间流媒体的低延迟多声道音频。

与标准音频驱动程序的连接

使用标准音频驱动程序(如asio,wasapi,coreaudio和Alsa)读取和写入音频样本(如USB或Thunderbolt™)跨窗户®, 苹果电脑®和Linux.®操作系统。

低延迟多通道音频流

过程实时音频马铃薯以毫秒的往返延迟。

从四通道麦克风阵列的实时原始输入。

机器学习和深度学习

标签,增强,创建和摄取音频和语音数据集,提取功能和计算时频变换。使用统计和机器学习工具箱™,深度学习工具箱™或其他机器学习工具开发音频和语音分析。

预训练的深度学习模式

使用深度学习执行复杂的信号处理任务,并提取音频嵌入用一行代码。访问已建立的预先训练的网络,如YAMNet、VGGish、CREPE和OpenL3,并在预先配置的特征提取功能的帮助下应用它们。

单词云显示所识别的声音类型classifysound.在特定的音频段中。

音频,语音和声学的特征提取

将信号转换为像MEL,BARK和ERB谱图等时频表示。计算抗谱系数,例如MFCC和GTCC,以及标量特征,例如音高,谐波和光谱描述符。使用预先培训的深度学习模型(VAGAD,OpenL3)和I载体系统提取高级功能和信号嵌入式。用兼容的GPU卡加速特征提取。

机器学习模型和培训配方

用您的音频数据集列车最先进的机器学习。使用扬声器识别和验证等应用程序的建立的模型系统,例如i-vectors。从工作示例中学习如何为音频,语音和声学应用程序设计和培训高级神经网络和层。

在包括五种不同扬声器的语音信号上使用X载体获得的日记结果。

导入,注释和预处理音频数据集

读取,分区和预处理大集合音频录制。用应用程序手动向音频信号注释。使用预先训练的机器学习模型自动识别和分段区域区域。

音频标签应用程序中的兴趣区域标签。

增强和综合音频和语音数据集

使用音调转移,时间拉伸和其他音频处理效果的组合设置随机数据增强管道。使用基于文本到语音云的服务从文本创建合成语音录制。

共振峰估计的音色不变的音高转移。

音频处理算法和效果

生成标准波形,应用常见的音频效果,并设计带有动态参数调整和实时可视化的音频处理系统。

音频过滤器和均衡器

模型和应用参数eq,图形eq,搁架和可变斜率滤波器。设计和模拟数字交叉,延期和分数倍频滤波器。

具有实时可视化的三频交叉滤波器的交互式调整。

动态范围控制和效果

模型和应用动态范围处理算法,如压缩机,限制器,膨胀机和噪声门。使用递归参数模型添加人为混响。

具有框图的系统仿真

使用Simulink的音频处理块图书馆设计和模拟系统模型万博1manbetx®。使用交互式控件和动态绘图调整参数和可视化系统行为。

多频带动态范围压缩机模型的细节在simulink中。万博1manbetx

实时音频原型设计

在MATLAB中使用交互式实时聆听测试进行验证音频处理算法。

通过用户界面进行实时参数调整

自动为音频处理算法的可调参数创建用户界面。使用自动生成的交互式控件的运行程序中的音频测试台应用程序和调谐参数测试单个算法。

使用音频测试台的自定义三频带参数eq的交互式调整。

MIDI连接参数控制和消息交换

使用MIDI控制曲面交互式改变MATLAB算法的参数。通过发送和接收任何类型的MIDI消息来控制外部硬件或响应事件。

Matlab中写入MATLAB的MIDI消息和音频信号流量,用于乐器合成器。

声学测量和空间音频

测量系统响应,分析和仪表信号,以及设计空间音频处理系统。

基于标准的计量和分析

将声压水平(SPL)仪表和响度计施加到录制或实时信号。分析八度音阶和分数倍频滤波器的信号。将标准符合标准的A,C-,或K加权过滤器应用于原始录制。测量声学清晰度,粗糙度和波动强度。

在两个三倍频带中可视化不同的SPL测量。

脉冲响应测量

测量声音和音频系统的脉冲和频率响应具有最大限度序列(MLS)和指数扫描正弦曲线(ESS)。开始使用脉冲响应测量值应用程序。通过以编程方式产生激励信号和估计系统响应来自动化测量。

脉冲响应测量器应用程序。

有效卷积与房间脉冲响应

使用频域重叠或重叠和保存实现将具有长脉冲响应的长脉冲响应的信号。使用自动脉冲响应分区进行计算速度的延迟延迟。

脉冲响应持续五秒钟或超过44100Hz的样本。

空间音频

编码和解码不同的双声速格式。插值空间采样头部相关传递函数(HRTF)。

HRTF测量所需声源位置和最近角度的例子。

生成和主机音频插件

用MATLAB编写的音频处理算法原型作为标准音频插件;使用外部音频插件作为常规MATLAB对象。

生成音频插件

直接从MATLAB代码生成VST插件,AU插件和独立的可执行插件,无需手动设计用户界面。对于更高级插件原型设计,生成即可建立的juce C ++项目(需要Matlab Coder™)。

多波段参数EQ示例:VST插件由MATLAB代码生成并在REAPER中运行。

托管外部音频插件

使用外部VST和AU插件作为常规MATLAB对象。更改插件参数和以编程方式处理MATLAB阵列。或者,使用用户界面和MIDI控件自动化插件参数的关联。从MATLAB代码生成的主机插件,以提高执行效率。

用于音频去噪(AccusOnus ERA-N)的外部VST插件示例和Matlab中的编程接口。

目标嵌入式和实时音频系统

使用代码生成来实现软件设备上的音频处理设计,并自动访问音频接口。

CPU和GPU目标的代码生成

用马斯沃斯®编码器产品,s manbetx 845生成C和C ++源代码从信号处理和机器学习算法提供作为工具箱功能,对象和块。从SELECT Feation提取功能生成CUDA源代码MFCC.MELSPectRoge.

用于基于深度学习的语音命令识别系统的ARM Cortex - A处理器的优化实现动态分析

低成本和移动设备

使用车载或外部多通道音频接口进行覆盆子PI™上的原型音频处理。创建交互式控制面板作为Android的移动应用程序®或iOS设备。

树莓派3板设计原型。

零延迟系统

原型音频处理设计,具有用于自适应噪声控制,助听器验证或需要最小往返DSP延迟的其他应用程序的单模输入和输出。直接从Simulink型号自动定位SpeedGoat Audio Machines和ST发现板。万博1manbetx