次元削減と特徴抽出

主成分分析,因子分析,特徴選択,特徴抽出など

“特徴変換”手法では,データを新しい特徴量に変換することによりデータの次元を減らします。“特徴選択”手法は,カテゴリカル変数がデータに含まれている場合など,変数を変換できない場合に適しています。特に最小二乗近似に適している特徴選択手法については,ステップワイズ回帰を参照してください。

関数

すべて展開する

特徴選択

`fscchi2`	カイ二乗検定を使用した分類に向けた一変量の特徴量ランク付け
`fscmrmr`	最小冗余最大相关性(MRMR)アルゴリズムを使用した分類用の特徴量のランク付け
`fscnca`	分類に近傍成分分析を使用する特徴選択
`fsrftest`	F検定を使用した回帰のための一変量の特徴量ランク付け
`fsrnca`	回帰に近傍成分分析を使用する特徴選択
`fsulaplacian`	ラプラシアンスコアを使用して教師なし学習の特徴量をランク付け
`partialDependence`	部分従属の計算
`plotPartialDependence`	部分依存プロット(PDP)および個別条件付き期待値(ICE)プロットの作成
`oobPermutedPredictorImportance`	分類木のランダムフォレストに対するout-of-bag予測子の並べ替えによる予測子の重要度の推定
`oobPermutedPredictorImportance`	回帰木のランダムフォレストに対するout-of-bag予測子の並べ替えによる予測子の重要度の推定
`predictorImportance`	分類木の予測子の重要度の推定
`predictorImportance`	決定木の分類アンサンブルに関する予測子の重要度の推定
`predictorImportance`	回帰木の予測子の重要度の推定
`predictorImportance`	回帰アンサンブルの予測子の重要度の推定
`relieff`	ReliefFまたはRReliefFアルゴリズムを使用した予測子の重要度のランク付け
`sequentialfs`	カスタム基準を使用した逐次特徴選択
`stepwiselm`	ステップワイズ回帰の実行
`stepwiseglm`	ステップワイズ回帰による一般化線形回帰モデルの作成

特徴抽出

`黎加`	再構成ICAの使用による特徴抽出
`sparsefilt`	スパースフィルターの使用による特徴抽出
`变换`	抽出された特徴量への予測子の変換

t-SNE多次元可視化

tsne t分布型確率的近傍埋め込み

PCAと正準相関

`巴特`	バートレットの検定
`canoncorr`	正準相関
`主成分分析`	生データの主成分分析
`pcacov`	共分散行列の主成分分析
`pcares`	主成分分析の残差
`车牌提取`	確率的主成分分析

因子分析

`factoran`	因子分析
`rotatefactors`	因子負荷量の回転

非負値行列因子分解

nnmf 非負値行列因子分解

多次元尺度構成法

`cmdscale`	従来型の多次元尺度構成法
`泰姬陵`	マハラノビス距離
`mdscale`	非従来型の多次元尺度構成法
`pdist`	観測値ペア間のペアワイズ距離
`squareform`	距離行列の形式

プロクラステス解析

普罗克汝斯忒斯 プロクラステス解析

オブジェクト

すべて展開する

特徴選択

`FeatureSelectionNCAClassification`	近傍成分分析(NCA)を使用する分類用の特徴選択
`FeatureSelectionNCARegression`	近傍成分分析(NCA)を使用する回帰用の特徴選択

特徴抽出

`ReconstructionICA`	再構成ICAによる特徴抽出
`SparseFiltering`	スパースフィルターによる特徴抽出

トピック

特徴選択

特徴選択の紹介

特徴選択アルゴリズムについて学び,特徴選択に使用できる関数を確認します。

逐次特徴選択

このトピックでは,逐次特徴選択の基本を説明し,カスタム基準と関数sequentialfsを使用して逐次的に特徴量を選択する例を示します。

近傍成分分析(NCA)特徴選択

近傍成分分析(NCA)は,特徴量を選択するためのノンパラメトリックな手法であり,回帰および分類アルゴリズムの予測精度を最大化することを目的とします。

判別分析分類器の正則化

モデルの予測力を損なわずに予測子を削除して,よりロバストで簡潔なモデルを作成します。

ランダムフォレストの予測子の選択

交互作用検定アルゴリズムを使用してランダムフォレストの分割予測子を選択します。

特徴抽出

特徴抽出

特徴抽出は,高レベルの特徴をデータから抽出する一連の方法です。

特徴抽出のワークフロー

この例では,イメージデータからの特徴抽出を行う完全なワークフローを示します。

混合信号の抽出

この例では,黎加を使用して混合オーディオ信号を分離する方法を示します。

t-SNE多次元可視化

t-SNE

t-SNEは,元のデータの一部の特徴量を保持したまま2または3次元への非線形削減を行うことにより高次元データを可視化する方法です。

t-SNEの使用による高次元データの可視化

この例では,高次元データの有用な低次元埋め込みをt-SNEで作成する方法を示します。

tsneの設定

この例では,さまざまなtsneの設定の影響を示します。

t-SNEの出力関数

出力関数の説明とt-SNEの例です。

PCAと正準相関

主成分分析(PCA)

主成分分析では,相関関係がある複数の変数を元の変数の線形結合である新しい一連の変数に置き換えることにより,データの次元を削減します。

PCAの使用による米国の都市における生活満足度の分析

重み付き主成分分析を実行し,結果を解釈します。

因子分析

因子分析

因子分析は,多変量データにモデルをあてはめることにより,少数の観測されない(潜在的な)因子に対する測定された変数の相互依存を推定する方法です。

因子分析の使用による株価の分析

因子分析を使用して,同じ部門の会社では株価が週単位で同じように変化しているかどうかを調べます。

試験の成績に対する因子分析の実行

この例では、统计和机器学习工具箱™を使用してクラスター分析を実行する方法を示します。

非負値行列因子分解

非負値行列因子分解

"非負値行列因子分解"（“NMF”)は特徴空間の低ランク近似に基づく次元削減手法です。

非負値行列因子分解の実行

乗法アルゴリズムおよび交互最小二乗アルゴリズムを使用して非負値行列因子分解を実行します。

多次元尺度構成法

多次元尺度構成法

多次元尺度構成法では,多くの種類の距離または非類似度の尺度について点と点の近さを可視化し,データを低次元で表現することができます。

古典的多次元尺度構成法

cmdscaleを使用して従来型の(計量)多次元尺度構成法(別名“主座標分析”)を実施します。

非空間的距離に適用した古典的な多次元尺度構成法

この例では、统计和机器学习工具箱™の関数cmdscaleを使用して古典的な多次元尺度構成法(MDS)を実行する方法を示します。

非従来型の多次元尺度構成法

この例では,古典的でない多次元尺度構成法(MDS)を使用してデータの相違性を可視化する方法を示します。

非従来型および非計量多次元尺度構成法

mdscaleを使用して非従来型の多次元尺度構成法を実行します。

プロクラステス解析

プロクラステス解析

プロクラステス解析では,最良の形状維持ユークリッド変換を使用して,比較したランドマークデータ間の位置の違いを最小化します。

プロクラステス解析の使用による手書き形状の比較

プロクラステス解析を使用して2つの手書きの数字を比較します。

注目の例

高次元のデータを分類する特徴量の選択

この例では,高次元データを分類するための特徴量を選択する方法を示します。具体的には,最も一般的な特徴選択アルゴリズムのひとつである逐次特徴選択を実行する方法を示します。ホールドアウトと交差検証を使用して,選択した特徴量の性能を評価する方法についても示します。

ライブスクリプトを開く

部分最小二乗回帰と主成分回帰

この例では,部分最小二乗回帰(PLSR)と主成分回帰(PCR)の適用方法を示し,これら2つの手法の有効性について説明します。PLSRとPCRは,どちらも,高相関性または共線性のある多数の予測子変数がある場合に,応答変数をモデル化するために使用する手法です。どちらの手法も,オリジナルの予測子変数の線形結合として,成分と呼ばれる新しい予測子変数を作成しますが,それらの成分の作成方法は異なります。PCRは,応答変数を一切考慮することなく,予測子変数での観測された変動を説明する成分を作成します。一方,PLSRは応答変数を考慮するため,少ない数の成分で応答変数を近似できるモデルにつながります。特定の用途について,これが最終的により倹約的なモデルを意味するかどうかは,コンテキストによります。

スクリプトを開く

主成分分析を使用した直交回帰の近似

この例では,主成分分析(PCA)により線形回帰を近似する方法を示します。PCAは,データから近似モデルまでの垂直距離を最小化します。この分析は,直交回帰または全最小二乗と呼ばれるものの線形バージョンであり,応答変数と予測子変数の間に自然な区分がない場合,またはすべての変数が誤差ありで測定される場合に適しています。これは,予測子変数が正確に測定され,応答変数のみが誤差成分をもつ,通常の回帰仮定とは対照的なものです。

ライブスクリプトを開く

次元削減と特徴抽出

関数

特徴選択

特徴抽出

t-SNE多次元可視化

PCAと正準相関

因子分析

非負値行列因子分解

多次元尺度構成法

プロクラステス解析

オブジェクト

特徴選択

特徴抽出

トピック

特徴選択

特徴抽出

t-SNE多次元可視化

PCAと正準相関

因子分析

非負値行列因子分解

多次元尺度構成法

プロクラステス解析

注目の例

高次元のデータを分類する特徴量の選択

部分最小二乗回帰と主成分回帰

主成分分析を使用した直交回帰の近似

统计和机器学习工具箱ドキュメンテーション

サポート

機械学習をマスターする:MATLABステップ・バイ・ステップガイド