音频工具箱

音频工具箱

设计和分析语音、声学和音频处理系统

开始:

带有音频接口的流媒体采集和播放

连接到标准笔记本电脑和台式机声卡,在任何文件组合和实时输入输出之间传输低延迟多声道音频。

连接到标准音频驱动程序

使用标准音频驱动程序(如ASIO, WASAPI, CoreAudio和ALSA)跨Windows从声卡(如USB或Thunderbolt™)读写音频样本®,Mac®和Linux®操作系统。

低延迟多通道音频流

处理实时音频MATLAB具有毫秒的往返延迟。

现场原始输入四通道麦克风阵列。

机器学习与深度学习

标签,增加,创建和摄取音频和语音数据集,提取特征,并计算时频转换。使用统计学和机器学习工具箱™,深度学习工具箱™,或其他机器学习工具开发音频和语音分析。

预先训练的深度学习模型

使用深度学习执行复杂的信号处理任务,提取音频嵌入与单行代码。访问已建立的预先训练的网络,如YAMNet、VGGish、CREPE和OpenL3,并在预先配置的特征提取函数的帮助下应用它们。

Word cloud显示由classifySound在一个特定的音频片段。

音频,语音和声学的特征提取

将信号转换成时频表征,如Mel、Bark和ERB谱图。计算倒谱系数,如MFCC和GTCC,以及标量特征,如音调、谐波和谱描述符。使用预先训练的深度学习模型(VGGish, OpenL3)和i-向量系统提取高级特征和信号嵌入。加速特征提取与兼容的GPU卡。

机器学习模型和训练食谱

用您的音频数据集训练最先进的机器学习。使用已建立的模型系统,如i-vector,用于发言者识别和验证等应用程序。从工作示例中学习如何设计和训练音频、语音和声学应用的高级神经网络和层。

使用x向量对包括五个不同说话人的语音信号进行二值化得到的结果。

导入、注释和预处理音频数据集

读取、分区和预处理大量音频记录集合。用应用程序手动标注音频信号。使用预先训练的机器学习模型自动识别和分割感兴趣的区域。

在音频标签应用程序感兴趣的区域标签。

扩充和合成音频和语音数据集

建立随机的数据增强管道使用组合的音高移动,时间拉伸,和其他音频处理效果。使用基于文本到语音的云服务从文本创建合成语音录音。

音色不变音调移动的共振峰估计。

音频处理算法及效果

生成标准波形,应用常见音频效果,设计带有动态参数调优和实时可视化的音频处理系统。

音频滤波器和均衡器

建模并应用参数均衡器、图形均衡器、搁置和可变斜率滤波器。设计并模拟数字交叉、倍频程和分数倍频程滤波器。

交互式调整三波段交叉滤波器,实时可视化。

动态范围控制和效果

建模并应用动态范围处理算法,如压缩机、限幅器、扩展器和噪声门。加入人工混响递归参数模型。

用方框图进行系统仿真

使用Simulink中的音频处理模块库设计和仿真系统模型万博1manbetx®.使用交互式控件和动态绘图调整参数并可视化系统行为。

详细介绍了在Simulink中的多频带动态范围压缩机模型。万博1manbetx

实时音频原型

在MATLAB中通过交互式实时听力测试验证音频处理算法。

通过用户界面进行实时参数调整

自动创建用户界面的可调参数的音频处理算法。使用Audio Test Bench应用程序测试单个算法,并使用自动生成的交互控件在运行程序中调整参数。

使用音频测试台对自定义三波段参数均衡器进行交互式调谐。

用于参数控制和消息交换的MIDI连接

利用MIDI控制曲面交互改变MATLAB算法的参数。通过发送和接收任何类型的MIDI消息来控制外部硬件或响应事件。

MIDI消息和音频信号流用MATLAB编写,用于乐器合成器。

声学测量和空间音频

测量系统响应,分析和测量信号,并设计空间音频处理系统。

基于标准的计量和分析

应用声压级(SPL)计和响度计记录或现场信号。用八度和分数八度滤波器分析信号。对原始记录应用符合标准的A-、C-或k -加权过滤器。测量声锐度、粗糙度和波动强度。

不同声压级测量的可视化跨越两个第三倍频带。

脉冲响应测量

用最大长度序列(MLS)和指数扫描正弦波(ESS)测量声学和音频系统的脉冲和频率响应。开始使用脉冲响应测量应用程序。通过编程生成激励信号和估计系统响应,实现自动化测量。

脉冲响应测量程序。

有效卷积与房间脉冲响应

使用频域重叠加或重叠保存实现有效地卷积具有长脉冲响应的信号。使用自动脉冲响应分区来权衡延迟和计算速度。

在44100Hz下,持续5秒或超过220k样本的脉冲响应。

空间音频

编码和解码不同的两栖格式。插值空间采样的头部相关传递函数(HRTF)。

期望的声源位置和HRTF测量可用的最近角度的例子。

生成和宿主音频插件

用MATLAB编写的原型音频处理算法,作为标准音频插件;使用外部音频插件作为常规MATLAB对象。

生成音频插件

直接从MATLAB代码生成VST插件、AU插件和独立可执行插件,无需手动设计用户界面。对于更高级的插件原型,生成准备好的JuSE C++项目(需要MATLAB编码器)™).

多波段参数EQ示例:VST插件由MATLAB代码生成并在REAPER中运行。

托管外部音频插件

使用外部VST和AU插件作为常规MATLAB对象。更改插件参数并以编程方式处理MATLAB数组。或者,自动将插件参数与用户界面和MIDI控件关联。托管从MATLAB代码生成的插件,以提高执行效率。

用于音频去噪的外部VST插件示例(Accusonus ERA-N)和MATLAB中的编程接口。

目标嵌入式和实时音频系统

使用代码生成在软件设备上实现音频处理设计,并自动访问音频接口。

CPU和GPU目标的代码生成

与MathWorks®编码器产品,s manbetx 845生成C和c++源代码从信号处理和机器学习算法提供的工具箱函数,对象,和块。生成CUDA的源代码从选择特征提取函数mfccmelSpectrogram

基于深度学习的语音指令识别系统在ARM Cortex-A处理器上的动态分析优化实现

低成本和移动设备

通过使用板载或外部多通道音频接口,Raspberry Pi™上的原型音频处理设计。创建交互式控制面板作为Android的移动应用程序®或iOS设备。

树莓派3板设计原型。

实现零延迟的系统

具有单样本输入和输出的原型音频处理设计,用于自适应噪声控制、助听器验证或其他需要最小往返DSP延迟的应用程序。自动目标Speedgoat音频机和ST发现板直接从Simulink模型。万博1manbetx