教師なし学習は,ラベル付けされた応答がない入力データを使って推論を行うタイプの機械学習のアルゴリズムです。
最も一般的な教師なし学習の手法は,クラスター分析です。これは,データ内の隠れたパターンやグループ化を発見する探索的データ解析に使用されます。クラスターは,ユークリッド距離や確率的な距離などの指標に基づいて定義される類似度の尺度を使ってモデル化されます。
一般的なクラスタリングアルゴリズムには次のようなものがあります。
- 階層クラスタリング:クラスターツリーを作成して複数のレベルをもつ階層的なクラスター群を構築します。
- k平均法クラスタリング:クラスターの重心までの距離に基づいてデータをk個の異なるクラスターに分割します。
- 混合ガウスモデル:多変量正規密度コンポーネントの混合としてクラスターをモデル化します。
- 自己組織化マップ:データのトポロジーと分布を学習するニューラルネットワークを使用します。
- 隠れマルコフモデル:状態の系列を観測データから復元するために利用します。
教師なし学習は,シーケンス解析や遺伝子クラスタリングといったバイオインフォマティックス分野,系列やパターンのマイニングといったデータマイニングの分野,画像のセグメンテーションといった医療画像処理の分野,物体認識といったコンピュータビジョンの分野で用いられています。
教師なし学習アルゴリズムの詳細については,统计和机器学习工具箱™および深度学习工具箱™をご覧ください。