音频工具箱

设计和分析语音、声学和音频处理系统

下载免费试用版

查看定价

音频工具箱™ 提供用于音频处理、语音分析和声学测量的工具。它包括处理音频信号（如均衡和时间拉伸）的算法，估计声音信号指标（如响度和清晰度）的算法，以及提取音频特征（如MFCC和基音）的算法。它还提供先进的机器学习模型，包括i-vectors，以及预训练的深度学习网络，包括VGGish和CREPE。工具箱应用程序支持实时算法测试、脉冲响应测量和信号标记。工具箱提供ASIO、CoreAudio和其他声卡的流接口；MIDI设备；以及用于生成和托管VST和音频单元插件的工具。万博1manbetx

使用Audio Toolbox，您可以导入、标记和扩充音频数据集，以及提取特征以训练机器学习和深度学习模型。提供的预训练模型可应用于音频录制，以进行高级语义分析。

您可以实时制作音频处理算法的原型，或者通过将低延迟音频流到声卡或从声卡流出来运行自定义声学测量。您可以将算法转换为音频插件，以在外部主机应用程序（如数字音频工作站）中运行，从而验证算法。插件托管允许您使用外部音频插件作为常规音频^®对象。

开始:

带有音频接口的流媒体采集和播放

连接到标准笔记本电脑和台式机声卡，在任何文件组合和实时输入输出之间传输低延迟多声道音频。

连接到标准音频驱动程序

使用标准音频驱动程序(如ASIO, WASAPI, CoreAudio和ALSA)跨Windows从声卡(如USB或Thunderbolt™)读写音频样本^®，Mac^®，以及Linux^®操作系统。

来自音频工具万博1manbetx箱的音频支持

MATLAB中的实时音频

多声道声卡示例。

低延迟多通道音频流

处理现场音频输入MATLAB具有毫秒的往返延迟。

音频I/O:缓冲、延迟和吞吐量

测量音频延迟

流式实时音频算法的性能度量

来自四通道麦克风阵列的实时原始输入。

机器学习与深度学习

标记、扩充、创建和摄取音频和语音数据集，提取特征，并计算时频转换。使用统计和机器学习工具箱开发音频和语音分析™, 深度学习工具箱™, 或其他机器学习工具。

预先训练的深度学习模型

使用深度学习执行复杂的信号处理任务，并用一行代码提取音频嵌入。访问已建立的预先训练的网络，如YAMNet、VGGish、CREPE和OpenL3，并借助预配置的特征提取功能应用它们。

预训练网络

对音频信号中的声音进行分类

YAMNet神经网络

VGISH神经网络

Word cloud显示由classifySound在一个特定的音频片段。

音频、语音和声学的特征提取

将信号转换成时频表征，如Mel、Bark和ERB谱图。计算倒谱系数，如MFCC和GTCC，以及标量特征，如音调、谐波和谱描述符。使用预先训练的深度学习模型(VGGish, OpenL3)和i-向量系统提取高级特征和信号嵌入。加速特征提取与兼容的GPU卡。

音频特征提取程序

了解VGISH特性

基于深度学习的噪声中语音活动检测

语音命令的实时Mel频谱图。

机器学习模型和训练方法

用您的音频数据集训练最先进的机器学习。使用已建立的模型系统，如i-vector，用于发言者识别和验证等应用程序。从工作示例中学习如何设计和训练音频、语音和声学应用的高级神经网络和层。

了解ivectorSystem

基于X向量的说话人二值化

基于自定义SincNet层和深度学习的说话人识别

使用x向量对包括五个不同说话人的语音信号进行二值化得到的结果。

导入、注释和预处理音频数据集

读取、分区和预处理大量音频记录集合。用应用程序手动标注音频信号。使用预先训练的机器学习模型自动识别和分割感兴趣的区域。

了解音频数据存储

使用音频标签器标记音频

将音频文件数据导入信号标签机

“语音转录

在音频标签应用程序感兴趣的区域标签。

扩充和合成音频和语音数据集

使用音高变换、时间拉伸和其他音频处理效果的组合设置随机数据增强管道。使用基于文本到语音云的服务从文本创建合成语音录制。

语音合成

音频数据增强器

基音不变时间拉伸

变桨

音色不变基音偏移的共振峰估计。

音频处理算法及效果

生成标准波形，应用通用音频效果，设计具有动态参数调整和实时可视化的音频处理系统。

音频滤波器和均衡器

建模并应用参数均衡器、图形均衡器、搁置和可变斜率滤波器。设计并模拟数字交叉、倍频程和分数倍频程滤波器。

参数均衡

图形均衡

参数均衡器设计

交互式调整三波段交叉滤波器，实时可视化。

动态范围控制及其效果

建模并应用动态范围处理算法，如压缩机、限幅器、扩展器和噪声门。加入人工混响递归参数模型。

动态范围控制

多频带动态范围压缩

压缩机动态响应的交互调整。

用方框图进行系统仿真

使用Simulink的音频处理模块库设计和模拟系统模型万博1manbetx^®.使用交互式控件和动态绘图调整参数并可视化系统行为。

Simulink中的实时音频万博1manbetx

多频带动态范围压缩

详细介绍了在Simulink中的多频带动态范围压缩机模型。万博1manbetx

实时音频原型

在MATLAB中通过交互式实时听力测试验证音频处理算法。

通过用户界面进行实时参数调整

自动为音频处理算法的可调参数创建用户界面。使用音频测试台应用程序测试各个算法，并使用自动生成的交互控件调整运行程序中的参数。

音频测试工作台演练

实时参数调优

基于延迟的音频效果

使用音频测试台对自定义三波段参数均衡器进行交互式调谐。

用于参数控制和消息交换的MIDI连接

利用MIDI控制曲面交互改变MATLAB算法的参数。通过发送和接收任何类型的MIDI消息来控制外部硬件或响应事件。

什么是DAW、音频插件和MIDI控制器？

MIDI设备接口

音频插件的MIDI控件

使用MIDI控件面与Simulink模型交互万博1manbetx

MIDI消息和音频信号流用MATLAB编写，用于乐器合成器。

声学测量和空间音频

测量系统响应，分析和测量信号，设计空间音频处理系统。

基于标准的计量和分析

将声压级（SPL）计和响度计应用于录制或现场信号。使用倍频程和分数倍频程滤波器分析信号。对原始记录应用符合标准的A、C或K加权过滤器。测量声学锐度、粗糙度和波动强度。

响度标准化符合EBU R 128标准

倍频程频带的声压测量

THD+N测量与音调跟踪

使用头部跟踪的双耳音频渲染

隔音对感知噪音水平的影响

不同声压级测量的可视化跨越两个第三倍频带。

脉冲响应测量

用最大长度序列（MLS）和指数扫频正弦波（ESS）测量声学和音频系统的脉冲和频率响应。开始使用脉冲响应测量器应用程序。通过编程生成激励信号和估计系统响应，实现测量自动化。

脉冲响应测量器漫游

测量音频设备的频率响应

脉冲响应测量应用程序。

具有房间脉冲响应的有效卷积

使用频域重叠加或重叠保存实现有效地卷积具有长脉冲响应的信号。使用自动脉冲响应分区来权衡延迟和计算速度。

测量音频系统的脉冲响应

了解分区频域FIR滤波器

在44100Hz下，持续5秒或超过220k样本的脉冲响应。

空间音频

编码和解码不同的双音格式。内插空间采样的头部相关传递函数（HRTF）。

双音双耳解码

Ambisonic插件生成

HRTF测量可用的理想声源位置和最近角度示例。

生成并托管音频插件

原型音频处理算法作为标准音频插件在MATLAB中编写；使用外部音频插件作为常规MATLAB对象。

生成音频插件

直接从MATLAB代码生成VST插件、AU插件和独立可执行插件，无需手动设计用户界面。对于更高级的插件原型，生成准备好的JuSE C++项目（需要MATLAB编码器）™).

从MATLAB代码自动生成VST插件

音频插件示例库

设计一个音频插件

多波段参数均衡器示例：VST插件由MATLAB代码生成，并在REAPER中运行。

托管外部音频插件

使用外部VST和AU插件作为常规MATLAB对象。更改插件参数并以编程方式处理MATLAB数组。或者，自动将插件参数与用户界面和MIDI控件关联。托管从MATLAB代码生成的插件，以提高执行效率。

主机外部音频插件

用于音频去噪的外部VST插件示例(Accusonus ERA-N)和MATLAB中的编程接口。

目标嵌入式和实时音频系统

使用代码生成在软件设备上实现音频处理设计，并自动访问音频接口。

CPU和GPU目标的代码生成

与MathWorks^®编码器产品，s manbetx 845从信号处理和机器学习算法生成C和C++源代码，作为工具箱函数、对象和块提供。从选择的特征提取函数生成CUDA源代码，如mfcc和光谱图.

代码生成和GPU支持万博1manbetx

使用“英特尔MKL-DNN”生成噪声代码时的关键字识别

基于Raspberry-Pi的语音命令识别代码生成

基于深度学习的语音指令识别系统在ARM Cortex-A处理器上的动态分析优化实现

低成本和移动设备

基于树莓Pi的原型音频处理设计™ 通过使用车载或外部多声道音频接口。创建交互式控制面板作为Android的移动应用程序^®或iOS设备。

iOS设备的音频效果

基于Raspberry-Pi的参数化音频均衡器

万博1manbet万博1manbetxx针对Raspberry Pi硬件的Simulink支持包

树莓皮3板设计原型。

零延迟系统

具有单样本输入和输出的原型音频处理设计，用于自适应噪声控制、助听器验证或其他需要最小往返DSP延迟的应用程序。自动目标Speedgoat音频机和ST发现板直接从Simulink模型。万博1manbetx

STM32发现板的参数化音频均衡器

嵌入式编码器对ST Discovery万博1manbetx板的支持

Speedgoat硬件支持Simuli万博1manbetxnk Real Time的实时仿真和测试万博1manbetx

Cochlear Ltd.简化了人工耳蜗声音处理算法的开发

主动噪声控制–从建模到实时原型

产品资源：

文档例子视频产品要求发行说明功能技术文章用户故事硬件支持万博1manbetx 系统对象

音频工具箱

音频工具箱

设计和分析语音、声学和音频处理系统

开始: