统计和机器学习工具箱

统计と机械学习を使用してデータを分析およびモデル化

ビデオを见る

评価版

统计和机器学习工具箱™には，データを记述，解析，およびモデル化する关数やアプリが用意されています。记述统计および探索的データ解析のためのプロットを使用したり，确率分布をデータに近似したり，モンテカルロシミュレーションのために乱数を生成できるほか，仮说検定を行うことも可能です。回帰および分类アルゴリズムにより，データから推定を行い，予测モデルを作成できます。

また，多次元データの解析については，统计和机器学习工具箱では特徴选択，ステップワイズ回帰，主成分分析（PCA），正则化およびその他の次元削减方法が提供されており，モデルに影响を与える変数または特徴の特定が可能です。

このツールボックスは，SVM（サポートベクターマシン），ブースティングされた决定木とバギングされた决定木中，k近傍中，k平均，K -medoid法，阶层クラスタリング，混合ガウスモデルおよび隠れマルコフモデルを含む教师ありおよび教师なしの机械学习アルゴリズムを提供します。多くの统计手法および机械学习アルゴリズムは，メモリに收まりきらない大きなデータセットの计算に使用できます。

详细を见る：

无料の电子书：
机械学习をマスターする：MATLABステップ·バイ·ステップガイド

今すぐダウンロード

探索的データ解析

対话型グラフィックスによる统计プロッティング，记述统计を通じてデータを検讨します。クラスタリングを使用してパターンと特徴量を特定します。

可视化

确率プロット，箱ひげ図，ヒストグラム，Q-Qプロット，および多変量分析用の高度なプロット（树状図，バイプロット，アンドリュースプロットなど）を使用してデータを视覚的に探索します。

多変量データの可视化

利用可能な统计プロットの概要

グループ化されたデータの箱ひげ図

确率的近傍埋め込み法を用いた高次元データの可视化

多次元散布図を使用して，変数间の关系を検讨

记述统计

いくつかの关连性の高い変数を用いると，大规模なデータセットであっても，すばやく理解して记述することができます。

记述统计の概要

カテゴリ别の要约统计

欠损値を含むデータの取り扱い

カーネル平滑化关数を使用した密度の推定

グループ化された平均と分散を使用してデータを探索

クラスター分析

ķ平均法，K-中心点划分法，DBSCAN，阶层クラスタリング，混合ガウスおよび隠れマルコフモデルを使用してデータをグループ化し，パターンを见つけます。

クラスター分析の概要

与噪声应用基于密度的空间聚类（DBSCAN）

ķ平均法を用いた遗伝子発现様式の発见

混合ガウスモデルを使用したクラスタリング

2つの同心円グループにDBSCANを適用

特徴抽出および次元削减

生データを机械学习に最も适した特徴量に変换します。缲り返し，新たな特徴量を探索して作成し，パフォーマンスを最适化する特徴量の组を选択します。

特徴抽出

スパースフィルタリングや再构成型独立成分分析（RICA）などの教师なしの学习技术を使用して，データから特徴量を抽出します。専门的な手法を使用して，画像，信号，テキスト，および数値データから特徴量を抽出することもできます。

特徴抽出のワークフロー

计算机视觉工具箱™および图像处理工具箱™による画像の特徴抽出

信号处理工具箱™による信号の特徴抽出

文本分析工具箱™を使用したテキストデータの准备

ディープラーニングの特徴量を使用した画像分类

モバイル端末から提供された信号から特徴量を抽出

特徴选択

データのモデル化において，予测精度を最大限に高める特徴量の部分集合を自动的に特定します。特徴选択手法には，ステップワイズ回帰，逐次特徴选択，正则化，およびアンサンブル法などがあります。

高次元データを分类するための特徴选択

正则化を用いたモデル过适合の防止

逐次特徴选択

分类のための，近傍成分分析（NCA）を用いた特徴検出

NCAは，モデルの精度を保持する特徴量を选択するのに役立つ

特徴変换および次元削减

既存の（非カテゴリカル）特徴量を新しい予测子変数に変换して次元削减を行うと，记述力の小さい特徴量を落とすことができます。特徴量変换手法には，PCA，因子分析，非负値行列因子分解などがあります。

MATLAB^®による次元削减と特徴量変换手法の概要

PCAの使用による米国の都市における生活満足度の分析

特徴量の変换と选択手法

PCAは多変量データを，その情报の大部分を保持しながら，より低次元の直交座标系にそのデータを射影する。

机械学习

対话型アプリを使用して分类および回帰モデルを构筑します。特徴量を自动的に选択し，ハイパーパラメータを最适化してモデルを调整します。

予测モデルの学习，検证，调整

さまざまな机械学习アルゴリズムの比较，特徴量の选択，ハイパーパラメーターの调整，予测性能の评価を行います。

対话型アプリで予测モデルを构筑して自动的に最适化

MATLABによるデータアナリティクス（3:55）

予测モデルの构筑および评価におけるベストプラクティス

5:12

分类学习器アプリを使用した，データの分类

分类

カテゴリカルな応答変数を1つ以上の予测子の关数としてモデル化します。さまざまなパラメトリックおよびノンパラメトリックの分类アルゴリズム（ロジスティック回帰，SVM，ブースティングされた决定木とバギングされた决定木，単纯ベイズ，判别分析，K近傍法など）を使用します。

分类学习器アプリをブラウザーで试す

ランダムフォレストを使用した手书き认识

ROC曲线を使用した分类モデルの评価（4:43）

さまざまな分类器の分离（超）平面の可视化

分类学习器アプリで対话的に分类器の学习を実行

モデルの自动最适化

モデルの精度を高めるには，ハイパーパラメーターを自动的に调整し，特徴量を选択して，データセットの不均衡をコストマトリックスで対处します

ハイパーパラメーター最適化の説明（4:43）

ベイズ最适化のワークフロー

NCAを使用した回帰のためのロバスト特徴选択

不均衡なデータまたは一様でない误分类コストの対处

什么是AutoML？

ベイズ最适化を使用してハイパーパラメーターを效率的に最适化

回帰およびANOVA

连続応答変数を1つ以上の予测子の关数としてモデル化します。これには，线形および非线形回帰，混合效果モデル，一般化线形モデル，ノンパラメトリック回帰を使用します。分散分析（ANOVA）を使用して，分散をさまざまな発生源に割り当てます。

线形回帰および非线形回帰

多数の线形または非线形回帰アルゴリズムから选択して，复数の予测子または応答変数を持つ复雑なシステムの动作をモデル化します。多层または阶层型，线形，非线形，および一般化线形混合效果モデルを入れ子および/または交差変量效果と共に近似して，縦方向またはパネル分析，反复测定，および成长モデリングを実行します。

回帰学習器アプリによる回帰モデルの学習

非线形关系について

MATLABを使用した多层混合效果のモデル化（34:44）

一般化线形モデルの详细

回帰学习器アプリで対话的に回帰モデルを近似

ノンパラメトリック回帰

SVM，ランダムフォレスト，ガウス过程，ガウスカーネルなどは予测子と応答の关系を示すモデルを指定せずに，正确に近似をします。

サポートベクターマシン（SVM）回帰モデルの近似および最适化

回帰ランダムフォレストを使用して保険リスクを予测

ガウス過程回帰の詳細

分位点回帰を使用した外れ値の検出

分位点回帰を使用して，外れ値を识别

分散分析（ANOVA）

标本分散をいくつかの异なる発生源に帰し，変动がグループ内で発生したものか，异なるグループ间で発生したものなのかを决定します0.1因子，2因子，多因子，多変量，ノンパラメトリック分散分析（ANOVA），共分散分析（ANOCOVA），および反复测定分散分析（朗诺）を用います。

1因子ANOVAの概要

多重比较の详细

钓り合い型および非钓り合い型データに対する多因子分散分析（多因子ANOVA）

多因子分散分析（ANOVA）を使用してグループを検定

确率分布および仮说検定

分布をデータへ近似させます。サンプルごとの差异が有意か，またはランダムデータの変动に一致しているかを解析します。さまざまな分布から乱数を生成します。

确率分布

连続分布および离散分布の近似，统计プロットを使用した適合度の評価,40以上の异なる分布の确率密度关数および累积分布关数の计算を行うことができます。

分布钳工アプリを使用したデータのモデリング

利用可能な确率分布

多変量分布からの标本の计算，近似，生成

カスタム1変量分布の近似

分布钳工アプリを使用して対话的に分布を近似

乱数生成

近似した确率分布または作成した确率分布から，拟似乱数ストリームおよび准乱数ストリームを生成します。

乱数を対话的に生成する

准乱数生成

モンテカルロシミュレーションの详细

コピュラを使用した従属変数のシミュレーション

乱数を対话的に生成

仮说検定

吨検定，分布検定（カイ二乘，ジャック - ベラ，リリーフォースおよびコルモゴルフ - スミルノフ），および1标本，対応のある2标本，独立した2标本のノンパラメトリック検定を行います自己相关と乱数度の検定を行い，分布を比较します（2标本コルモゴルフ - スミルノフ）。

仮说検定の概要

片侧または両侧吨検定：割合または相关をテスト

2标本Ť検定を実行

カイ二乘适合度検定

片侧吨検定における弃却域

产业统计

效果とデータの倾向を统计的に分析します。カスタマイズされた実験计画法や统计的工程管理などの产业用统计技术を适用します。

実験计画法（DOE）

カスタマイズした実験计画法（DOE）を定义，分析，および可视化します。データ入力が出力に及ぼす影响の情报を生成できるよう，実用的な计画を作成，テストし，データ入力を操作します。

体系的データ收集による実験の计画の概要

応答曲面计画法（ボックスベーンケンなど）

ボックスベーンケン计画法を适用して，高次の応答曲面を生成

统计的工程管理（SPC）

プロセスの可変性を评価することで，制品やプロセスを监视，改良します。管理図の作成，工程能力の见积もり计算，およびゲージR＆R（反复性と再现性）の评価を行います。

管理図の绍介

シックスシグマ手法を使用してエンジン冷却ファンを改善

管理図を使用して制造工程を监视

信頼性および生存时间分析

コックス比例ハザード回帰を行い，分布の近似を実施することで，打ち切りの有无にかかわらず，故障までの时间データを可视化して分析します。経験的ハザード关数，生存时间关数，累积分布关数，およびカーネル密度推定値を计算します。

时间依存共変量を含むコックス比例ハザードモデル

カプランマイヤー法を用いた累积ハザード，生存时间，および累积分布の推定

コックス比例ハザードモデルを使用した再入场の推定

打ち切りを含む存続期間データの分析

「打ち切られた」値の例としての故障データ

ビッグデータとクラウドへの拡張

统计的および机械学习の手法をメモリに收まらないデータに适用します。クラスターやクラウドインスタンスでの统计的计算と机械学习モデルのトレーニングを高速化します。

高大的配列でビッグデータを分析する

多くの分类，回帰，クラスタリングアルゴリズムで高大的配列とテーブルを利用できます。それらを用いると，元のコードを変更せずに，メモリに收まらないデータセットを使ってモデルを学习させることができます。

フライトの遅延のモデリングを高大配列を用いて，大规模データセットで行う

高大的配列をサポートする关数の概要

毛虫におけるビッグデータ，データアナリティクス，机械/深层学习のインフラストラクチャ（18点47分）

分かりやすいMATLABの高配列の机能を活用して，ビッグデータだけでなくメモリに收まらないデータ（火花および的Hadoopに格纳されているデータを含む）へのアクセス，探索および处理を行います。

4:13

MATLAB高大的配列の活用

并列计算

并列化により统计计算とモデルトレーニングを高速化します。

并行计算工具箱™による机械学习の并列化の概要

MATLABで计算速度を上げる方法について

MATLAB与[Rのベンチマーク

MATLAB与Python的^®のベンチマーク

并行计算工具箱またはMATLAB并行服务器™を使用して计算を高速化

クラウドおよび分散コンピューティング

クラウドインスタンスを使用して,統計および機械学習の計算を高速化します.MATLAB在线™上で全機械学習ワークフローを実行してください。

MATLABリファレンスアーキテクチャを使用してAWSおよび天青^®のクラウドインスタンスにアクセス

网络ブラウザーでMATLAB在线にアクセス

NVIDIA^®GPUクラウドでクラウドインスタンスにアクセス

亚马逊または天青のクラウドインスタンスで计算を実行

展开とコード生成

统计や机械学习を组み込みシステムに展开し，Cコードを使用して计算负荷の高い计算を高速化して，エンタープライズシステムと统合します。

コード生成

MATLAB编码器^TM值を使用して,分類および回帰アルゴリズム,記述統計量,および確率分布を推定するために,移植可能で読み取り可能なCまたはc++コードを生成します.MATLAB函数ブロックとシステムブロックから機械学習モデルを使用して,高性能なシミュレーションの検証と確認の作業を高速化します。

コード生成ワークフローの概要

编码器アプリで机械学习モデルのÇコードを生成

分类とコード生成のための系统对象™

MATLAB功能ブロックを使用して的Simulink万博1manbetx^®で机械学习を适用

2つの実装方法：Cコードを生成するか，MATLABコードをコンパイルします。

アプリケーションおよびエンタープライズシステムとの统合

MATLAB编译™を使用して，统计，机械学习モデルをスタンドアロン，MapReduce的，星火™アプリケーション，网络アプリケーション，および微软^®高强^®アドインとして実装します.MATLAB编译器SDK™を使用して，C / C ++共有ライブラリ，微软.NETアセンブリ，爪哇^®クラス，および的Python^®パッケージを构筑します。

网络アプリで电気负荷の予测モデルを展开

スマートフォンへ人间行动の认识モデルを展开

MATLAB编译を使用して，空気の质の分类モデルを统合

展开済みモデルの更新

C / c++予測コードを再生成せずに,展開済みのモデルのパラメーターを更新します。

コード生成用のモデルパラメーターの更新

编码器配置者を使用した予测および更新用のコード生成

コード生成とモデル更新のワークフロー

新机能

自动化された机械学习（AutoML）

分类用の最适なモデルとそれに纽づいたハイパーパラメーターを自动的に选択（fitcauto）

特徴选択

分类问题にカイ二乘テスト（fscchi2），回帰问题に˚Fテスト（fsrftest）を使用して特徴をランク付け

コード生成

数値テーブルを用いて予测（MATLAB编码器が必要）

コード生成

决定木やアンサンブル学习用决定木の固定小数点C / C ++コードを生成（编码器MATLABおよび定点设计が必要）

GPUサポート

GPU上での実行により，更正件，随机，および32个の确率分布关数を高速化（并行计算工具箱が必要）

これらの机能および対応する关数の详细については，リリースノートを参照してください。

机械学习入门

ここでは，分类问题の実用的な机械学习方法の概要を対话形式で说明します。

详细を确认する

统计和机器学习工具箱

统计と机械学习を使用してデータを分析およびモデル化

详细を见る：

无料の电子书：机械学习をマスターする：MATLABステップ·バイ·ステップガイド

探索的データ解析

可视化

记述统计

クラスター分析

特徴抽出および次元削减

特徴抽出

特徴选択

特徴変换および次元削减

机械学习

予测モデルの学习，検证，调整

分类

モデルの自动最适化

回帰およびANOVA

线形回帰および非线形回帰

ノンパラメトリック回帰

分散分析（ANOVA）

确率分布および仮说検定

确率分布

乱数生成

仮说検定

产业统计

実験计画法（DOE）

统计的工程管理（SPC）

信頼性および生存时间分析

ビッグデータとクラウドへの拡張

高大的配列でビッグデータを分析する

并列计算

クラウドおよび分散コンピューティング

展开とコード生成

コード生成

アプリケーションおよびエンタープライズシステムとの统合

展开済みモデルの更新

新机能

自动化された机械学习（AutoML）

特徴选択

コード生成

コード生成

GPUサポート

机械学习入门

その他の统计和机器学习工具箱リソース

无料评価版を入手する

购入する

あなたは学生ですか？

试す，购入する

使い方を学ぶ

无料の电子书：
机械学习をマスターする：MATLABステップ·バイ·ステップガイド