电子书

第1章:ディプラニングを利用すべき理由

第 1 章

パタン認識にディプラニングを利用すべき理由


ディープラーニングは,データ内のパターンを見つけるためのモデルの開発に使用されますが,これを実行する方法は他にもあります。この章では,なぜ他の手法ではなくディ。

dl-engineers-ebook-ch1-model-training-daisy

一度学習させたモデルは,ラベル付けされていないデータを入力しても,学習時に取り込んだ情報をもとに,最も適したラベルを適用します。

セクション

パタン認識

以下は,パタ2。1つは線形回帰を使用してセンサーデータの経時的な傾向を判断し,もう1つはk - meansアルゴリズムを使用してデータを類似のグループにクラスター化しています。

dl-engineers-ebook-ch1-linear-reg-k-means

ディープラーニング以外の手法の多くが持つ利点は,ロジックがより理解しやすいことと,比較的単純で少ない量のデータを使用することです。ディープニューラルネットワークを学習させる場合に,それが機能する理由を説明するのは難しく,ネットワークの学習には質の高いラベル付きデータがより多く必要となります。これを踏まえると,なぜ別の手法ではなくディプラニングが選択されるのでしょうか。理由の1つは,ディープラーニングが大きな解空間の中から極めて複雑なパターンを検出することに適しているためです。

例として,画像内の特定のオブジェクトを検出してラベル付けし,オブジェクトの追跡や位置推定を行う場合や,ハードウェアの欠陥や素材の損傷がないか目視点検する場合などが挙げられます。

dl-engineers-ebook-ch1-raw-data-identified-pattern
dl-engineers-ebook-ch1-concrete-damage

上の例では,パタ,ンは,歩行者や欠けたコンクリ,トなどを表す特定のピクセルの組み合わせです。これらは複雑なパターンであり,インスタンスごとに大きく異なる場合もあれば,他のパターンとほとんど区別がつかないほど微妙に変化する場合もあります。このため,選択したアルゴリズムは,こうした複雑なパターンの分類だけでなく,非常に大きな解空間での分類が必要になります。

画像以外のデタにも複雑なパタンが存在します。オーディオ信号では,話し言葉(発声単語)を認識したり,数秒の楽節から曲を識別したりする必要があります。

また,時系列信号には,予知保全アプリケ,ションや生物医学業界にあるような複雑なパタ,ンもあります。

面板的导航

ディプラニングを使用した時系列予測

長·短期記憶(lstm)ネットワクを使用して時系列デタを予測します。

面板的导航

長·短期記憶ネットワクを使用したecg信号の分類

生理网2017年挑战からの心拍心電図(ECG)データをディープラーニングと信号処理を使用して分類します。

面板的导航

ウェブレット解析とディプラニングを使用した時系列の分類

連続ウェーブレット変換(CWT)と深層畳み込みニューラルネットワーク(CNN)を使用して人間の心電図(ECG)信号を分類します。

上記のケースでは,その複雑度と解が存在する範囲の広さから,人間が自分でロジックを作成して管理しなければならないルールベースのアプローチを考えることは困難です。こうした場合に,ディプラニングはより優れたアプロチになります。

注:本电子书の例では,デタに離散ラベルを適用する”分類を中心に説明しています。ただし,モデルの出力が離散ラベルではなく連続値である”回帰も,ディプラニングに使用できます。回帰用の畳み込みニュラルネットワク(cnn)の学習に。

ディープラーニングでは,ディープニューラルネットワークを用いて,入力データと出力分類の関係をモデル化します。本章ではニューラルネットワークの詳細については説明しませんが,単純に捉えるなら,ネットワークとは,データに対してそれぞれ特定の操作を実行する一連の層です。初期の層では大きなパターン内に存在する小さな特徴を検索し,以降の層ではそうした特徴の組み合わせを調べて,データに最も適したラベルを決定するという傾向があります。

dl-engineers-ebook-ch1-model-training-car
セクション

パタン定義に役立特徴とは

ディープラーニングの利点と,特徴の識別がより大きなパターン認識にどう役立つかを理解するために,加速度データからハイタッチを認識できるアルゴリズムを開発する必要がある場合を考えてみましょう。

下の画像では,プロットは3種類の腕の動きに対する加速度のパタンを示しています。中央のプロットがハ邮箱タッチです。では,ハイタッチのパターンを他に想定される腕の動作と区別するアルゴリズムの開発には,どのように取り組めばいいでしょうか。

すべての特徴が既知の場合

まず行うことは,この問題に対するシンプルなルルベスのアプロチを検討することかもしれません。1つの解決策として考えられるのは,既知のハイタッチプロファイルを使用して,センサーから連続して入力される加速度の測定値とパターンマッチングさせることです。たとえば2つの信号間の標準偏差を調べて,偏差が一定のしきい値以下になった場合に”ハイタッチ”と表示するといった関数です。

しかし,このアプロチの難しい点は,どのハ。人によって,手をより速くまたは遅く動かしたり,手のひらを打ち合わせる直前に一瞬止めたり,変わったやり方でハイタッチをしたりすることもあります。仮に代表的なプロファイルを複数用意できたとしても,こうしたアプローチでは,まだ認識したことがないハイタッチ動作には対応できない可能性があります。さらに,ハイタッチを確実にとらえようとプロファイルを増やしすぎたり,標準偏差のしきい値を引き上げたりすると,該当しない動作に誤ってハイタッチとラベル付けしてしまう危険性もあります。

より賢明なアプローチは,バリエーションが無数に存在するパターン全体を対象にするのではなく,どのハイタッチにも共通する小さな特徴を探せばよいと理解することです。

明示的にデタを収集していない新しいハタッチが見られた場合であっても,「低速-低速-高速」という加速の組み合わせはハ邮箱タッチだと主張することができるかもしれません。たとえば下の図のハイタッチの場合,見た目は違っても,同じように”低速——低速——高速”という加速の特徴を示しています。

dl-engineers-ebook-ch1-high-five-graph-comparison

小さな特徴を探し,それがいつ,どの順番で現れるかを確認することで,単純なフルパターンのマッチングアルゴリズムよりも優れたルールベースの分類器を設計できます。

このようなルールベースの分類器の難しい点は,正しく分類するために必要な最適な特徴を確実に定義するには,探すべきパターンを熟知している必要があるということです。また,背の低い人,内気な人、文化の差など,アルゴリズムに意図せずに偏りが生じないよう,すべてのバリエーションに確実に対応している必要もあります。複雑なパタンの場合には,手作業では時間がかかり,対処が不可能なこともあります。

すべての特徴が既知ではない場合

ディプラニングはこのような問題の解決に有効です。パタンの特徴は,直感的でなくても,設計者が明示的に定義しなくても,自動的に学習されます。このため,データ内の複雑なパターンを分類しようとして,そのパターンを他のパターンと区別するルールをすべて定義することはできないという場合には,ディープラーニングがよい選択肢となるかもしれません。

ただし,ディプラニングには独自の要件があるという点に注意してください。大量の質の高いラベル付きデータが必要であり,適切なネットワークアーキテクチャが必要であり,確実にそのネットワークをターゲットプロセッサに展開し,割り当てられた時間内に実行できるようにする必要があります。次の章では,こうした要件にいて説明します。