统计和机器学习工具箱

통계및머신러닝으로데이터를를분석하고모델링할수수수수

统计和机器学习工具箱™는데이터를를,분석분석,모델링하는함수와을제공합니다。탐색적이터분석데위해기술,시각시각,군집군집를사용하고,데이터터에분포를를하며,몬테카를로시뮬레이션을을위해난수생성생성,가설설검정을수행할수수수생성생성생성생성생성생성회귀와분류알고리즘을통해이터로부터추론을도출하고,분류학습기및회귀앱을이용해해대화형방식,또는自动을을을해프로그래밍방식예측모델을구축할있습니다있습니다수있습니다있습니다있습니다있습니다있습니다있습니다있습니다있습니다있습니다있습니다있습니다있습니다있습니다있습니다있습니다있습니다있습니다있습니다있습니다있습니다있습니다있습니다있습니다있습니다있습니다있습니다있습니다있습니다있습니다있습니다있습니다있습니다있습니다있습니다있습니다있습니다있습니다있습니다있습니다있습니다있습니다있습니다있습니다있습니다있습니다있습니다있습니다있습니다있습니다있습니다있습니다있습니다있습니다있습니다있습니다있습니다있습니다있습니다있습니다있습니다수수수수수수

다차원데이터분석분석과과특징특징위해위해,이툴박스는사용자용자변수를할할을pca(주성분분석),정규화,차원축소,특징선택을제공합니다。

툴박스는SVM(서포트벡터머신),부스팅결정트리,k -평균및기타군집화방법등을포함한지도,준지도,비지도머신러닝알고리즘을제공합니다。부분종속성플롯、石灰등의해석력기법을적용하고,임베디드기기로의배포를위해자동으로C / c++코드를생성할수도있습니다。툴박스의많은알고리즘은메모리에담기에너무큰데이터세트에대해서사용할수있습니다。

시작하기:

탐색적데이터분석

대화형그래픽과기술통계량을이용하여통계플로팅을통해데이터를탐색할수있습니다。군집화로패턴과특징을식별할수있습니다。

시각화

확률플롯,상자플롯,히스토그램,분위수 - 분위수플롯및덴드로그램,행렬도,앤드류스플롯등다변량분석을위한고급플롯을이용하여데이터를시각적으로탐색할수있습니다。

다차원산점도플롯을이용한한변수간간관계관계

기술통계량

관련성이높은몇몇의수치를이용하여잠재잠재적인대규모이터세트세트를이해하고하고설명할수수수해설명할수수

그룹화한평균분산을이용한데이터탐색。

군집분석

K-평균,k-중앙개체,dbscan,계층계층및스펙트럼군집,가우스우스모델,은닉은닉모델을이용해이터를를그룹그룹화패턴을발견할수

두동심그룹에dbscan적용。

특징추출및차원축소

원시원시이터를머신러닝에가장적합적합한특징으로변환수수새로운특징을반복적탐색하고만들며성능을최적하는특징을선택할할있습니다있습니다。

특징추출

희소희소및복원ica등비지도학습기법을이용하여하여이터로부터특징을추출할수있습니다있습니다있습니다있습니다있습니다있습니다있습니다있습니다수있습니다있습니다있습니다있습니다수수있습니다있습니다수수수있습니다있습니다있습니다수수있습니다있습니다있습니다수있습니다있습니다수수수수특수기법을이용하여이미지,신호,텍스트,숫자형데이터특징에서특징을추출할수도수도

모바일기기에서제공한신호에서특징추출。

특징선택

데이터를를모델링할때의예측검정력을제공하는특징을자동으로으로수수수수수수특징선택방법에는단계적,순차순차특징선택,정규화,앙상블앙상블등이있습니다。

NCA는모델의정확도를가장잘보존하는특징을선택하게해줍니다。

특징변환및차원축소

차원을축소하여의(비범주형)특징들을새로운예측변수변환하면덜적인특징들버릴수수수수수있습니다。특징변환방법에는pca,요인요인,비음수행렬등이있습니다。

PCA는는대부분의의정보보존한채로고차원고차원벡터를직교좌표계에사합니다

머신러닝

대화형앱이나자동머신러닝(automl)을이용하여예측적분류회귀회귀을구축할수수수。자동으로특징을선택최적모델을식별하이퍼파라미터파라미터를를조정할수

예측예측모델의,검증및조정

다양다양한머신러닝알고리즘알고리즘을비교,특징을선택하며,하이퍼파라미터파라미터를조정,널리사용되는되는다양한분류및알고리즘의성능성능을평평평평수수수수수수수수수수수수수수수수수수대화형앱으로예측을구축하고에이용데데용용모델모델적적할수수수할수수수수수수있습니다수수수수수수수수있습니다수수수수수수수수수수

모델해석력

부분종속성플롯,冰(个体条件期望),石灰(局部可解释模型 - 不可知解释)등기성가능성모델을적용하여블랙박스머신러닝모델의을개선할수수의해석력개선할수있습니다의을개선할수있습니다

石灰은복잡한모델의간단한사모델모델모델을국지적구축구축구축

자동머신러닝(自动机)

자동으로하이퍼파라미터파라미터를조정하고특징과모델선택하며비용행렬로행렬로터세트불균형을해결해결으로써의성능을을개선할수수

이즈베화를이용한한효율적인인하최적최적최적파라미터최적최적

회귀및분산분석(ANOVA)

선형및비선형회귀,혼합효과모델,일반화선형모델,비모수적회귀를이용하여연속응답변수를하나또는여러예측변수의함수로모델링할수있습니다。Anova를이용하여하여하여분산다양다양한요인할당할수

선형및비선형회귀

많은선형및비선형회귀알고리즘에서선택한복수의예측변수또는응답변수를사용하여복잡한시스템의동작을모델링할수있습니다。다중수준또는계층적,선형,비선형,일반화선형혼합효과모델과중첩및/또는교차임의효과를피팅시켜,종단분석또는패널분석,반복측정,성장모델링을수행할수있습니다。

회귀학습기앱을사용한한대화형방식의회귀모델모델

비모수적회귀

svm,랜덤포레스트,가우스과정,가우스커널을이용,예측예측변수와응답변수의관계기술하는모델을지정지정하지정확한을을생성할수수한한을생성생성수수있습니다정확한을을생성할수수있습니다한피팅을생성할수수수한있습니다피팅을생성생성할수수있습니다있습니다피팅을생성생성수수수수수있습니다을생성수수수수수

분위수회귀를이용한이상값식별。

方差分析(분산분석)

이변분산해보고변에에에변아니면아니면집단에발생할아니면수에발생할수수수수수수수수수수할수수수수할수수수수할할수일원,이원,다원,다변량,비모수비모수anova와공분산분석(Anocova),반복반복분산분석(Ranova)을사용할할수。

다원方差分析를사용한그룹검정。

확률분포및가설검정

분포를데이터에에피팅할수수표본간차이유의미유의미한지또는임의의터와일치하는지분석수수수수수다양다양한분포로부터로부터난수생성할수수

확률분포

연속분포와이산분포분포를피팅통계플롯을사용하여적합도를가하며40가지이상상의에대해확률확률밀도함수함수누적분포함수를를계산할수

분포피팅기앱을사용한한대화형방식의분포피팅피팅

난수생성

피팅된확률분포또는된된분포로부터의사난수및및준난수스트림을생성할수

대화형방식의난수생성。

가설검정

하나의표본,표본쌍또는독립표본에대해t-검정,분포검정(카이제곱,jarque-bera,lilliefors,콜모고로프 - 스미르노프)및및적검정을수행할있습니다있습니다。자동자동교정및임의성을검정하고(2-표본콜모고로프 - 스미르노프)를를할수있습니다。

단측t-검정의기각영역。

산업통계

효과와데이터의의추세를통계적으로분석할수사용자지정지정실험계획법및통계적공정관리등산업통계기법적용할할수

DOE(실험계획법)

사용자지정doe를를,분석,시각화할수。데이터입력입력값을조작하고동시에데터터값에미치는영향에대한를생성할지에관한관한계획만들고만들고테스트할수수

box-behnken설계를적용한적용한반응표면생성생성。

SPC(통계적공정관리)

공정변동을가하여제품이나공정을모니터링하고개선수있습니다있습니다。관리도관리도를만들고공정능력을추정하며하며하며반복성및재현성연구를할수수수할할수

관리도를이용한제조공정모니터링。

신뢰도및생존분석

콕스(COX)비례위험회귀를수행하여이있는경우와없는경우평균고장시간을화하고분석후분포를경험경험적위험,생존생존,누적분포함수,커널커널밀도추정값을계산수수수수

'중도절단'값의예로서고장고장이터。

빅데이터,병렬화,클라우드컴퓨팅

메모리에담을수없는이터에에통계및머신러닝기법을적용할수00

高大배열을사용한빅이터분석

다양한분류,회귀,군집화알고리즘에高大형배열과테이블을사용하여,코드를변경하지않고메모리에담을수없는데이터세트에대해모델을훈련시킬수있습니다。

병렬연산



并行计算工具箱또는MATLAB并行服务器를이용한한연산속도。

클라우드및분산연산

클라우드인스턴스를사용하여통계및머신러닝속도속도향상시킬수있습니다。Matlab Online™에서전체머신러닝워크플로를수행할있습니다。

亚马逊또는Azure클라우드인스턴스에서의연산수행。

배포,코드생성,sim万博1manbetxulink통합

통계및머신러닝을임베디드시스템에하고하고코드이용하여연산집약인인계산를가속하며하며,엔터엔터이즈시스템시스템및​​및모델모델과할수수수수수万博1manbetx

코드생성

분류분류회귀알고리즘,기술통계량,확률분포를추론수이식성과가독성이좋은c또는c ++코드코드matlab编码器™를사용하여생성수수있습니다。固定点设计器™를이용하여감소된의c / c ++예측코드를하고,예측코드를재생성않고도않고도된모델파라미터를업데이트트할수수수수수수

두가지배포배포:c코드생성또는matlab코드코드。

万博1manbetxSimulink와와의

머신러닝모델을si万博1manbetxmulink모델에통합하여임베디드하드웨어하거나시스템시스템이션,검증,확인에활용할수。

응용프로그램및엔터프라이즈시스템시스템과

Matlab Compiler™를사용하여하여통계및머신러닝모델을단독모델모델모델모델모델모델모델모델또는또는또는또는응용프로그램,웹앱앱微软®excel.®추가기능기능으로배포할수수수Matlab Compiler SDK™를사용하여사용하여c / c ++공유공유이브러리,Microsoft .NET어셈어셈,Java®클래스,Python®패키지를구축할수있습니다。

Matlab Compiler를사용한한대기대기분류모델모델모델

统计和机器学习工具箱추가리소스