音频工具箱

음성, 음향 및 오디오 처리 시스템을 설계 및 분석할 수 있습니다.

音频工具箱™는오디오처리,음성분석및음향측정을위한툴을제공합니다。이툴박스에는이퀄라이제이션과타임스트레칭같은오디오신호처리,음량및선명도와같은음향신호메트릭추정,그리고MFCC및피치와같은오디오특징추출을위한알고리즘이포함되어있습니다。또한矢量i와같은고급머신러닝모델과VGGish및绉등의사전훈련된딥러닝신경망도제공합니다。音频工具箱의앱은실시간알고리즘테스트,임펄스응답측정및신호레이블지정작업을지원합니다。툴박스는ASIO, CoreAudio및기타사운드카드에대한스트리밍인터페이스,MIDI기기,그리고威仕特및音频单元플러그인을생성하고호스트하기위한툴을제공합니다。

音频工具箱를사용하면오디오데이터셋을가져오고레이블을지정하고보강할수있을뿐만아니라특징을추출하여머신러닝및딥러닝모델을훈련시킬수도있습니다。제공되는사전훈련된모델을오디오녹음에적용하여하이레벨의미분석을수행할수있습니다。

실시간으로오디오처리알고리즘을프로토타이핑하거나,사운드카드와의저지연오디오스트리밍을통해사용자지정음향측정을실행할수있습니다。알고리즘검증은디지털오디오워크스테이션과같은외부호스트응용프로그램에서실행할오디오플러그인으로변환하여수행할수있습니다。플러그인을호스트하여외부오디오플러그인을일반MATLAB®객체로 사용할 수 있습니다.

시작하기:

오디오인터페이스를통한스트리밍수집및재생

파일과 실시간 입출력 간의 저지연 다중채널 오디오 스트리밍을 위해 표준 랩탑 및 데스크탑의 사운드 카드에 연결할 수 있습니다.

표준오디오드라이버연결

窗户®、Mac®및 Linux®운영 체제에서 표준 오디오 드라이버(예: ASIO、WASAPI、CoreAudio、ALSA)를 사용하여 通用串口总线또는 霹雳™ 등을 통해 사운드 카드에서 오디오 샘플을 읽고 쓸 수 있습니다.

저지연다중채널오디오스트리밍

밀리초단위의양방향지연시간으로MATLAB에서 실시간 오디오를 처리할 수 있습니다.

4-채널 마이크 배열로부터의 실시간 원시 입력.

머신러닝및딥러닝

오디오 및 음성 데이터셋에 레이블을 지정하고, 증대하고, 생성하고, 수집하고, 특징을 추출하고, 시간-주파수 변환을 계산할 수 있습니다. 统计和机器学习工具箱™, 深度学习工具箱™ 또는 기타 머신러닝 툴로 오디오 및 음성 분석을 개발할 수 있습니다.

사전훈련된딥러닝모델

딥러닝을사용하여한줄의코드로복잡한신호처리작업을수행하고오디오임베딩을추출할수있습니다。YAMNet VGGish,绉및OpenL3와같은기존의사전훈련된신경망을사용하고,미리구성된특징추출함수를활용하여이러한신경망을적용할수있습니다。

특정오디오세그먼트에서分类声音로식별되는소리유형을표시하는워드클라우드。

오디오,음성및음향의특징추출

신호를梅尔、树皮및ERB스펙트로그램과같은시간-주파수표현으로변환할수있습니다。MFCC및GTCC와같은켑스트럼계수와피치,조화비및스펙트럼설명자와같은스칼라특징을계산할수있습니다。사전훈련된딥러닝모델(VGGish OpenL3)과矢量i시스템을사용하여하이레벨특징과신호임베딩을추출할수있습니다。호환되는GPU카드를활용하여특징추출을가속화할수있습니다。

음성 명령의 실시간 멜 스펙트로그램.

머신러닝 모델 및 훈련 레시피

오디오데이터셋으로첨단머신러닝을훈련시킬수있습니다。화자식별및검증과같은응용분야에矢量i와같은기존모델시스템을사용할수있습니다。작동하는예제를통해오디오,음성및음향응용분야를위한고급신경망과계층을설계및훈련시키는방법을알아볼수있습니다。

5명의서로다른화자가있는음성신호에서向量x를사용하여얻은구분결과。

오디오 데이터셋 가져오기, 주석 추가 및 전처리

대량의오디오녹음을읽고분할하고전처리할수있습니다。앱을활용하여오디오신호에직접주석을추가할수있습니다。사전훈련된머신러닝모델을사용하여관심영역을자동으로식별및분할할수있습니다。

音频贴标签机앱의관심영역레이블。

오디오 및 음성 데이터셋 증대 및 합성

피치시프팅,타임스트레칭및기타오디오처리효과의조합을사용하여무작위데이터증대작업을설정할수있습니다。클라우드기반텍스트-음성변환서비스를사용하여텍스트에서합성음성녹음을생성할수있습니다。

음색불변피치시프팅에대한포먼트추정。

오디오처리알고리즘및효과

동적 파라미터 조정과 실시간 시각화를 통해 표준 파형을 생성하고, 일반적인 오디오 효과를 적용하고, 오디오 처리 시스템을 설계할 수 있습니다.

오디오 필터 및 이퀄라이저

파라메트릭 情商,그래픽 情商,셸빙 및 가변 기울기 필터를 모델링하고 적용할 수 있습니다. 디지털 크로스오버, 옥타브 및 분수 옥타브 필터를 설계하고 시뮬레이션할 수 있습니다.

실시간시각화를통한3 -대역크로스오버필터의대화형방식조정。

동적 범위 제어 및 효과

압축기, 리미터, 확장기 및 잡음 게이트와 같은 동적 범위 처리 알고리즘을 모델링하고 적용할 수 있습니다. 재귀 파라메트릭 모델로 인공 잔향을 추가할 수 있습니다.

대화형 방식으로 압축기의 동적 응답 조정하기.

블록다이어그램을사용한시스템시뮬레이션

万博1manbetx®의오디오처리블록라이브러리를사용하여시스템모델을설계하고시뮬레이션할수있습니다。대화형방식제어및동적플롯을사용하여파라미터를조정하고시스템동작을시각화할수있습니다。

万博1manbetx仿真软件에서보는다중대역동적범위압축기모델。

실시간 오디오 프로토타이핑

MATLAB에서 대화형 방식의 실시간 청취 테스트를 통해 오디오 처리 알고리즘을 검증할 수 있습니다.

사용자인터페이스를통한실시간파라미터조정

오디오처리알고리즘의조정가능한파라미터에대한사용자인터페이스를자동으로생성할수있습니다。音频试验台앱을사용하여개별알고리즘을테스트하고자동생성된대화형방식의컨트롤로실행중인프로그램의파라미터를조정할수있습니다。

音频测试台를 사용한 사용자 지정 3-대역 파라메트릭 情商의 대화형 방식 조정.

파라미터컨트롤및메시지교환을위한MIDI연결

MIDI컨트롤표면을사용하여MATLAB알고리즘의파라미터를대화형방식으로변경할수있습니다。모든유형의MIDI메시지를송수신하여외부하드웨어를제어하거나이벤트에응답할수있습니다。

악기 합성기에 대해 MATLAB에서 작성된 迷笛메시지 및 오디오 신호 흐름.

음향측정및공간오디오

시스템 응답을 측정하고, 신호를 분석하고 재며, 공간 오디오 처리 시스템을 설계할 수 있습니다.

표준기반측정및분석

녹음된 신호 또는 실시간 신호에 SPL(음압 레벨) 측정기와 음량 측정기를 적용할 수 있습니다. 옥타브 및 분수 옥타브 필터로 신호를 분석할 수 있습니다. 원본 녹음본에 표준 준수 A、 C또는 K가중 필터를 적용할 수 있습니다. 음향 선명도, 거칠기 및 변동 강도를 측정할 수 있습니다.

두1/3옥타브대역에걸친다양한SPL측정값의시각화。

임펄스 응답 측정

美国职业足球大联盟(최대길이시퀀스)와ESS(지수스윕정현파곡선)가포함된음향및오디오시스템의임펄스와주파수응답을측정할수있습니다。脉冲响应测量器앱으로시작할수있습니다。프로그래밍방식으로가진신호를생성하고시스템응답을추정하여측정을자동화할수있습니다。

脉冲响应测量器앱。

공간임펄스응답을통한효율적인컨벌루션

주파수 영역 중첩-가산 또는 중첩-보류 구현을 사용하여 긴 임펄스 응답을 가진 신호를 효율적으로 컨벌루션할 수 있습니다. 자동 임펄스 응답 분할을 사용하여 지연과 계산 속도 간에 절충할 수 있습니다.

22 44100 hz에서만개의샘플로,또는5초이상지속되는임펄스응답。

공간 오디오

다양한 앰비소닉 음향 형식을 인코딩하고 디코딩할 수 있습니다. 공간적으로 샘플링된 HRTF(머리 전달 함수)를 보간할 수 있습니다.

HRTF측정값을 구할 수 있는 바람직한 음원 위치 및 가장 가까운 각도의 예.

오디오플러그인생성및호스트

MATLAB에서작성된오디오처리알고리즘을표준오디오플러그인으로프로토타이핑할수있습니다。외부오디오플러그인을일반MATLAB객체로사용할수있습니다。

오디오플러그인생성

사용자 인터페이스를 직접 설계할 필요 없이 MATLAB코드에서 VST플러그인, 金플러그인, 독립형 실행 파일 플러그인을 직접 생성할 수 있습니다. 더 고도화된 플러그인을 프로토타이핑하려면 구축 준비된 JC+ C++프로젝트를 생성할 수 있습니다. (MATLAB)编码器™ 필요)

다중대역 파라메트릭 情商예제: MATLAB코드에서 생성되고 收割者에서 실행되는 VST플러그인.

외부 오디오 플러그인 호스트

외부 VST및 金플러그인을 일반 MATLAB객체로 사용할 수 있습니다. 플러그인 파라미터를 변경하고 프로그래밍 방식으로 MATLAB배열을 처리할 수 있습니다. 또는 플러그인 파라미터와 사용자 인터페이스 및 迷笛컨트롤의 연결을 자동화할 수 있습니다. 실행 효율성을 높이기 위해 MATLAB코드에서 생성된 플러그인을 호스트할 수도 있습니다.

오디오잡음제거(Accusonus ERA-N)를위한외부威仕特플러그인및MATLAB의프로그래밍방식인터페이스의예。

임베디드및실시간오디오시스템타겟팅

코드 생성을 사용하여 소프트웨어 기기에서 오디오 처리 설계를 구현하고 오디오 인터페이스에 대한 액세스를 자동화할 수 있습니다.

中央处理器및 GPU타겟을 위한 코드 생성

迈斯沃克®코더제품을활용하여툴박스함수,객체및블록으로제공되는신호처리및머신러닝알고리즘에서C및c++소스코드를생성할수있습니다。mfcc光谱图과같은선별된특징추출함수에서CUDA소스코드를생성할수있습니다。

딥러닝 기반 음성 명령 인식 시스템의 臂皮质프로세서에서 최적화된 구현을 위한 동적 프로파일링

저가및모바일기기

온보드또는외부다중채널오디오인터페이스를사용하여覆盆子π™의오디오처리설계를프로토타이핑할수있습니다。安卓®또는 网间网操作系统기기용 모바일 앱으로 대화형 제어판을 만들 수 있습니다.

설계 프로토타이핑을 위한 树莓皮3보드.

무지연시스템

적응형 잡음 제어, 보청기 검증 또는 최소 양방향 数字信号处理器지연이 필요한 기타 응용 분야에 대한 단일 샘플 입출력이 포함된 오디오 처리 설계를 프로토타이핑할 수 있습니万博1manbetx다. 模拟모델에서 직접 快羊오디오 기기와 装货单디스커버리 보드를 자동으로 타겟팅할 수 있습니다.