主要内容

このページの翻訳は最新ではありません。ここをクリックして,英語の最新版を参照してください。

次元削減と特徴抽出

主成分分析,因子分析,特徴選択,特徴抽出など

“特徴変換”手法では,データを新しい特徴量に変換することによりデータの次元を減らします。“特徴選択”手法は,カテゴリカル変数がデータに含まれている場合など,変数を変換できない場合に適しています。特に最小二乗近似に適している特徴選択手法については,ステップワイズ回帰を参照してください。

関数

すべて展開する

fscchi2 カイ二乗検定を使用した分類に向けた一変量の特徴量ランク付け
fscmrmr 最小冗余最大相关性(MRMR)アルゴリズムを使用した分類用の特徴量のランク付け
fscnca 分類に近傍成分分析を使用する特徴選択
fsrftest F検定を使用した回帰のための一変量の特徴量ランク付け
fsrnca 回帰に近傍成分分析を使用する特徴選択
fsulaplacian ラプラシアンスコアを使用して教師なし学習の特徴量をランク付け
partialDependence 部分従属の計算
plotPartialDependence 部分依存プロット(PDP)および個別条件付き期待値(ICE)プロットの作成
oobPermutedPredictorImportance 分類木のランダムフォレストに対するout-of-bag予測子の並べ替えによる予測子の重要度の推定
oobPermutedPredictorImportance 回帰木のランダムフォレストに対するout-of-bag予測子の並べ替えによる予測子の重要度の推定
predictorImportance 分類木の予測子の重要度の推定
predictorImportance 決定木の分類アンサンブルに関する予測子の重要度の推定
predictorImportance 回帰木の予測子の重要度の推定
predictorImportance 回帰アンサンブルの予測子の重要度の推定
relieff ReliefFまたはRReliefFアルゴリズムを使用した予測子の重要度のランク付け
sequentialfs カスタム基準を使用した逐次特徴選択
stepwiselm ステップワイズ回帰の実行
stepwiseglm ステップワイズ回帰による一般化線形回帰モデルの作成
黎加 再構成ICAの使用による特徴抽出
sparsefilt スパースフィルターの使用による特徴抽出
变换 抽出された特徴量への予測子の変換
tsne t分布型確率的近傍埋め込み
巴特 バートレットの検定
canoncorr 正準相関
主成分分析 生データの主成分分析
pcacov 共分散行列の主成分分析
pcares 主成分分析の残差
车牌提取 確率的主成分分析
factoran 因子分析
rotatefactors 因子負荷量の回転
nnmf 非負値行列因子分解
cmdscale 従来型の多次元尺度構成法
泰姬陵 マハラノビス距離
mdscale 非従来型の多次元尺度構成法
pdist 観測値ペア間のペアワイズ距離
squareform 距離行列の形式
普罗克汝斯忒斯 プロクラステス解析

オブジェクト

すべて展開する

FeatureSelectionNCAClassification 近傍成分分析(NCA)を使用する分類用の特徴選択
FeatureSelectionNCARegression 近傍成分分析(NCA)を使用する回帰用の特徴選択
ReconstructionICA 再構成ICAによる特徴抽出
SparseFiltering スパースフィルターによる特徴抽出

トピック

特徴選択

特徴選択の紹介

特徴選択アルゴリズムについて学び,特徴選択に使用できる関数を確認します。

逐次特徴選択

このトピックでは,逐次特徴選択の基本を説明し,カスタム基準と関数sequentialfsを使用して逐次的に特徴量を選択する例を示します。

近傍成分分析(NCA)特徴選択

近傍成分分析(NCA)は,特徴量を選択するためのノンパラメトリックな手法であり,回帰および分類アルゴリズムの予測精度を最大化することを目的とします。

判別分析分類器の正則化

モデルの予測力を損なわずに予測子を削除して,よりロバストで簡潔なモデルを作成します。

ランダムフォレストの予測子の選択

交互作用検定アルゴリズムを使用してランダムフォレストの分割予測子を選択します。

特徴抽出

特徴抽出

特徴抽出は,高レベルの特徴をデータから抽出する一連の方法です。

特徴抽出のワークフロー

この例では,イメージデータからの特徴抽出を行う完全なワークフローを示します。

混合信号の抽出

この例では,黎加を使用して混合オーディオ信号を分離する方法を示します。

t-SNE多次元可視化

t-SNE

t-SNEは,元のデータの一部の特徴量を保持したまま2または3次元への非線形削減を行うことにより高次元データを可視化する方法です。

t-SNEの使用による高次元データの可視化

この例では,高次元データの有用な低次元埋め込みをt-SNEで作成する方法を示します。

tsneの設定

この例では,さまざまなtsneの設定の影響を示します。

t-SNEの出力関数

出力関数の説明とt-SNEの例です。

PCAと正準相関

主成分分析(PCA)

主成分分析では,相関関係がある複数の変数を元の変数の線形結合である新しい一連の変数に置き換えることにより,データの次元を削減します。

PCAの使用による米国の都市における生活満足度の分析

重み付き主成分分析を実行し,結果を解釈します。

因子分析

因子分析

因子分析は,多変量データにモデルをあてはめることにより,少数の観測されない(潜在的な)因子に対する測定された変数の相互依存を推定する方法です。

因子分析の使用による株価の分析

因子分析を使用して,同じ部門の会社では株価が週単位で同じように変化しているかどうかを調べます。

試験の成績に対する因子分析の実行

この例では、统计和机器学习工具箱™を使用してクラスター分析を実行する方法を示します。

非負値行列因子分解

非負値行列因子分解

"非負値行列因子分解"“NMF”)は特徴空間の低ランク近似に基づく次元削減手法です。

非負値行列因子分解の実行

乗法アルゴリズムおよび交互最小二乗アルゴリズムを使用して非負値行列因子分解を実行します。

多次元尺度構成法

多次元尺度構成法

多次元尺度構成法では,多くの種類の距離または非類似度の尺度について点と点の近さを可視化し,データを低次元で表現することができます。

古典的多次元尺度構成法

cmdscaleを使用して従来型の(計量)多次元尺度構成法(別名“主座標分析”)を実施します。

非空間的距離に適用した古典的な多次元尺度構成法

この例では、统计和机器学习工具箱™の関数cmdscaleを使用して古典的な多次元尺度構成法(MDS)を実行する方法を示します。

非従来型の多次元尺度構成法

この例では,古典的でない多次元尺度構成法(MDS)を使用してデータの相違性を可視化する方法を示します。

非従来型および非計量多次元尺度構成法

mdscaleを使用して非従来型の多次元尺度構成法を実行します。

プロクラステス解析

プロクラステス解析

プロクラステス解析では,最良の形状維持ユークリッド変換を使用して,比較したランドマークデータ間の位置の違いを最小化します。

プロクラステス解析の使用による手書き形状の比較

プロクラステス解析を使用して2つの手書きの数字を比較します。

注目の例