主要内容

语音转录与合成

为文本到语音和语音到文本使用预训练的模型或第三方api

音频工具箱™提供了小词汇表识别和声音合成的示例。使用wav2vec 2.0预训练网络执行一般语音到文本的转录speech2text.您可以从文件交换下载音频工具箱扩展功能语音合成而且语音识别通过接口到流行的第三方api。万博1manbetx支持的api包括谷歌®演讲中,IBM®沃森语音和微软®Azure的演讲。

中,可以以图形方式与语音转文本功能交互信号贴标签机应用程序快速标签的语言区域。

应用程序

信号贴标签机 标记信号属性、区域和兴趣点,并提取特征

功能

speech2text 将语音信号转录为文本
text2speech 从文本中合成语音
speechClient 与预训练模型或第三方语音服务接口

主题