主要内容

机器学习与音频深度学习

数据集管理、标记和扩充;音频、语音和声学应用的分割和特征提取

音频工具箱™ 提供为音频、语音和声学应用(包括说话人识别、语音命令识别、声学场景识别等)开发机器和深度学习解决方案的功能。万博 尤文图斯

  • 使用音频数据存储接收大型音频数据集并并行处理文件。

  • 使用音频贴标机通过手动和自动注释音频记录来构建音频数据集。

  • 使用音频数据增强器创建内置或自定义信号处理方法的随机管道,用于增强和合成音频数据集。

  • 使用音频特征提取器在共享中间计算的同时提取不同特征的组合。

“音频工具箱”还提供对文本到语音和语音到文本的第三方API的访问,它包括预训练的VGISH和YAMNet模型,以便您可以执行迁移学习、声音分类和提取特征嵌入。使用预先训练的网络需要深入的学习™.

特色实例