主要内容

audioDeviceReader

声卡录音

描述

audioDeviceReader系统对象™使用计算机的音频输入设备读取音频样本。

看到音频I/O:缓冲,延迟和吞吐量详细说明了音频设备读取器的数据流。

音频设备阅读器指定驱动程序、设备及其属性,以及System对象输出的数据类型和大小。

从音频设备传输数据:

  1. 创建audioDeviceReader对象并设置其属性。

  2. 使用参数调用对象,就像调用函数一样。

有关系统对象如何工作的详细信息,请参见什么是系统对象?

创建

描述

deviceReader= audioDeviceReader返回一个System对象,deviceReader它可以使用音频输入设备实时读取音频样本。

deviceReader= audioDeviceReader (sampleRateValue设置SampleRate财产sampleRateValue

deviceReader= audioDeviceReader (sampleRateValuesampPerFrameValue设置SamplesPerFrame财产sampPerFrameValue

deviceReader= audioDeviceReader (___名称,值设置每个属性的名字到指定的价值。未指定的属性有默认值。

例子:deviceReader = audioDeviceReader(16000,'BitDepth','8-bit integer')创建一个System对象,deviceReader,它以16 kHz采样率和8位整数位深度工作。

属性

全部展开

除非另有说明,属性为nontunable,这意味着在调用对象后不能更改它们的值。对象在调用时锁定,而释放功能解锁它们。

如果属性为可调,您可以随时更改其值。

有关更改属性值的详细信息,请参见使用系统对象的MATLAB系统设计

用于访问音频设备的驱动程序,指定为声音处理软件的“ASIO”,或“WASAPI”

  • ASIO™驱动程序没有预先安装在Windows上®机器。使用“ASIO”驱动选项,在MATLAB外部安装ASIO驱动程序®

    请注意

    如果司机指定为“ASIO”,使用asiosettings将声卡缓冲区大小设置为SamplesPerFrame你的价值audioDeviceReader系统对象。

  • WASAPI驱动程序只支持独占模式。万博1manbetx

ASIO和WASAPI驱动程序不提供采样率转换。ASIO和WASAPI驱动,设置SampleRate到音频设备支持的采样率。万博1manbetx

此属性仅适用于Windows计算机。Linux®机器总是使用ALSA驱动程序。Mac机器总是使用CoreAudio驱动程序。

数据类型:字符|字符串

用于获取音频样本的设备,指定为字符向量或字符串。使用getAudioDevices列出所选驱动程序的可用设备。

数据类型:字符|字符串

音频设备获取的输入通道数,以整数形式指定。的范围NumChannels这取决于你的音频硬件。

依赖关系

若要启用此属性,请设置ChannelMappingSource“汽车”

数据类型:||int8|int16|int32|int64|uint8|uint16|uint32|uint64

从音频设备读取的帧大小,指定为正整数。SamplesPerFrame也是您的设备缓冲区的大小和输出矩阵的列数由您的audioDeviceReader对象。

数据类型:||int8|int16|int32|int64|uint8|uint16|uint32|uint64

设备用于获取音频数据的采样率,单位为Hz,指定为正整数。的范围SampleRate这取决于你的音频硬件。

数据类型:||int8|int16|int32|int64|uint8|uint16|uint32|uint64

设备用于获取音频数据的数据类型,指定为字符向量或字符串。

数据类型:字符|字符串

音频输入设备的通道与输出矩阵的列之间的映射源,指定为“汽车”“属性”

  • “汽车”默认设置决定了设备通道和输出矩阵之间的映射。例如,假设您的音频设备有六个可用通道,并且您设置了NumChannels6。对音频设备阅读器的调用的输出是一个六列矩阵。列1对应通道1,列2对应通道2,依此类推。

  • “属性”——这是ChannelMapping属性确定音频设备的通道与输出矩阵的列之间的映射。

数据类型:字符|字符串

音频输入设备的通道与输出矩阵列之间的非默认映射,指定为有效通道索引的向量。看到为audioDeviceReader指定通道映射获取更多信息。

依赖关系

若要启用此属性,请设置ChannelMappingSource“属性”

数据类型:||int8|int16|int32|int64|uint8|uint16|uint32|uint64

输出的数据类型,指定为字符向量或字符串。

请注意

如果OutputDataType指定为“双”“单一”,音频设备阅读器输出范围[- 1,1]的数据。对于其他数据类型,取值范围为指定数据类型的[min, max]。

数据类型:字符|字符串

使用

描述

例子

audioFromDevicedeviceReader()从选定的音频输入设备返回一帧音频样本。

例子

(audioFromDevicenumOverrun] =deviceReader()返回自上次调用以来音频阅读器队列溢出的样本数deviceReader

注意:当你打电话给audioDeviceReader对象指定的音频设备设备财产已被锁定。一个音频设备只能被一个人锁定audioDeviceReader一次。要释放音频设备,请呼叫释放在你的audioDeviceReader对象。

输出参数

全部展开

音频信号从设备读取,以矩阵形式返回。指定的通道数和SamplesPerFrame属性确定矩阵大小。矩阵的数据类型取决于OutputDataType财产。

数据类型:||int16|int32|uint8

自最后一次调用以来音频阅读器队列溢出的样本数deviceReader

数据类型:uint32

对象的功能

要使用对象函数,请将System对象指定为第一个输入参数。例如,释放system对象的系统资源obj,使用这种语法:

发行版(obj)

全部展开

getAudioDevices 列出可用的音频设备
信息 获取音频设备信息
克隆 创建重复的系统对象
isLocked 确定系统对象正在使用中
释放 释放资源并允许更改系统对象属性值和输入特征
重置 重置的内部状态系统对象
一步 运行系统对象算法
设置 系统对象的一次性设置任务

例子

全部折叠

用麦克风录制10秒的演讲,并将输出发送到WAV文件。

创建一个audioDeviceReader对象使用默认设置。调用设置减少音频流循环中初始化的计算负荷。

deviceReader = audioDeviceReader;设置(deviceReader)

创建一个dsp。AudioFileWriter系统对象。指定要写入的文件名和类型。

fileWriter = dsp。AudioFileWriter (“mySpeech.wav”“FileFormat”“WAV”);

录下10秒的演讲。在音频流循环中,从设备读取音频信号帧,并将音频信号帧写入指定文件。该文件保存到当前文件夹。

disp (“现在对着麦克风说话。”
现在对着麦克风说话。
抽搐toc < 10 acquiredAudio = deviceReader();fileWriter (acquiredAudio);结束disp (记录完整。
记录完成。

释放音频设备并关闭输出文件。

发布(deviceReader)发布(fileWriter)

延迟由于输入设备缓冲区是获取一帧数据的时间延迟。在本例中,修改对象的默认属性audioDeviceReader对象以减少延迟。

创建一个audioDeviceReader对象使用默认设置。

deviceReader = audioDeviceReader
deviceReader = audioDeviceReader with properties: Device: 'Default' NumChannels: 1 SamplesPerFrame: 1024 SampleRate: 44100显示所有属性

计算由于设备缓冲区造成的延迟。

流('由于设备缓冲区导致的延迟:%f秒。\n'deviceReader.SamplesPerFrame / deviceReader.SampleRate)
由于设备缓冲区导致的延迟:0.023220秒。

设置SamplesPerFrame您的财产audioDeviceReader对象64。计算延迟。

deviceReader。SamplesPerFrame = 64;流('由于设备缓冲区导致的延迟:%f秒。\n'deviceReader.SamplesPerFrame / deviceReader.SampleRate)
由于设备缓冲区造成的延迟:0.001451秒。

设置SampleRate您的财产audioDeviceReader系统对象为96000。计算延迟。

deviceReader。SampleRate=96000; fprintf('由于设备缓冲区导致的延迟:%f秒。\n'deviceReader.SamplesPerFrame / deviceReader.SampleRate)
由于设备缓冲区导致的延迟:0.000667秒。

泛滥指输入信号下降,当音频流循环不与设备同步时发生。确定音频流循环的溢出,为音频流循环添加人工计算负载,然后修改音频流循环的属性audioDeviceReader对象以减少溢出。你的成绩取决于你的电脑。

创建一个audioDeviceReader系统对象SamplesPerFrame设置为256而且SampleRate设置为44100。调用设置减少音频流循环中初始化的计算负荷。

deviceReader = audioDeviceReader(...“SamplesPerFrame”, 256,...“SampleRate”, 44100);设置(deviceReader)

创建一个dsp。AudioFileWriter对象。指定要写入的文件名和数据类型。

fileWriter = dsp。AudioFileWriter (“mySpeech.wav”“FileFormat”“WAV”);

录下5秒的演讲。在音频流循环中,从设备读取音频信号帧,并将音频信号帧写入指定文件。

totalOverrun = 0;disp (“现在对着麦克风说话。”
现在对着麦克风说话。
抽搐toc < 5 [input,numOverrun] = deviceReader();totaloverflow = totaloverflow + numOverrun;fileWriter(输入);结束流(“录音完成。\ n”
记录完成。
流('溢出的样本总数:%d.\n'totalOverrun)
溢出样本总数:0。
流('超时总秒数:%d.\n'双(totalOverrun) /双(deviceReader.SampleRate))
总超时秒数:0。

释放你的audioDeviceReader而且dsp。AudioDeviceWriter对象,并将计数器变量归零。

release(deviceReader) totaloverflow = 0;

使用暂停为音频流循环添加人工计算负载。计算负载导致音频流循环的速度比设备慢,从而导致采集的样本被丢弃。

disp (“现在对着麦克风说话。”
现在对着麦克风说话。
抽搐toc < 5 [input,numOverrun] = deviceReader();totaloverflow = totaloverflow + numOverrun;fileWriter(输入);暂停(0.01)结束流(“录音完成。\ n”
记录完成。
流('溢出的样本总数:%d.\n'totalOverrun)
总样本溢出数:97536。
流('超时总秒数:%d.\n'双(totalOverrun) /双(deviceReader.SampleRate))
总超时秒数:2.211701e+00。

释放你的audioDeviceReader而且dsp。AudioFileWriter对象,并设置SamplePerFrame财产512。设备缓冲区大小增加,所以设备现在需要更长的时间来获取一帧数据。将计数器变量设置为零。

release(fileWriter) release(deviceReader) deviceReader。SamplesPerFrame = 512;totalOverrun = 0;

使用修改后的音频流循环计算总溢出SamplesPerFrame财产。

disp (“现在对着麦克风说话。”
现在对着麦克风说话。
抽搐toc < 5 [input,numOverrun] = deviceReader();totaloverflow = totaloverflow + numOverrun;fileWriter(输入);暂停(0.01)结束流(“录音完成。\ n”
记录完成。
流('溢出的样本总数:%d.\n'totalOverrun)
溢出样本总数:0。
流('超时总秒数:%f.\n'totalOverrun / deviceReader.SampleRate)
总超时秒数:0.000000。

对象的非默认通道映射audioDeviceReader对象。这个例子是特定于硬件的。它假设您的计算机有一个默认的音频输入设备,有两个可用的通道。

创建一个audioDeviceReader对象使用默认设置。

deviceReader = audioDeviceReader;

默认通道数为1。打电话给你的audioDeviceReader对象,如不带参数的函数,从音频设备读取一帧数据。验证输出数据矩阵是否有一列。

x = deviceReader();[frameLength,numChannels] = size(x)
frameLength = 1024
numChannels = 1

使用信息以确定您指定的可用输入通道的最大数量司机而且设备配置。

信息(deviceReader)
ans =带字段的结构:驱动:'DirectSound' DeviceName: 'Primary Sound Capture Driver' MaximumInputChannels: 2

ChannelMappingSource“属性”。的audioDeviceReader对象必须解锁才能更改此属性。

(deviceReader) deviceReader发布。ChannelMappingSource =“属性”
deviceReader = audioDeviceReader with properties: Driver: 'DirectSound' Device: 'Default' SamplesPerFrame: 1024 SampleRate: 44100显示所有属性

默认情况下,如果ChannelMappingSource设置为“属性”,所有可用通道都映射到输出。打电话给你的audioDeviceReader对象从音频设备读取一帧数据。验证输出数据矩阵是否有两列。

x = deviceReader();[frameLength,numChannels] = size(x)
frameLength = 1024
numChannels = 2

使用ChannelMapping属性指定设备的通道与输出矩阵的列之间的替代映射。在与输出列对应的索引处指示输入通道号。要更改此属性,首先解锁audioDeviceReader对象。

(deviceReader) deviceReader发布。ChannelMapping = [2,1];

现在当你打电话给你的audioDeviceReader

  • 设备的输入通道1映射到输出矩阵的第二列。

  • 设备的输入通道2映射到输出矩阵的第一列。

从输入设备获取特定通道。

deviceReader。ChannelMapping = 2;

如果你打电话给audioDeviceReader,设备的输入通道2映射到输出向量。

扩展功能

版本历史

在R2016a中引入