电子书

딥러닝실용내서:데이터부터시작해배포까지

챕터

챕터1

왜패턴식에딥러닝을사용할까?


딥러닝은데이터에서패턴을찾을수있는모델을개발하는데사용됩니다。하지만데이터에서패턴을찾는방법이딥러닝만있는것은아닙니다。이챕터에서는다른방법대신딥러닝을선택할이유를살펴봅니다。

dl-engineers-ebook-ch1-model-training-daisy

일단모델이훈련되면레이블미지정데이터를모델에입력할수있으며모델은훈련중에학습한정보를기반으로가장확률이높은레이블을적용하게됩니다。

섹션

패턴marketing식

패턴식의두가지간단한예를보겠습니다。하나는선형회귀를사용하여시간에따른센서데이터추세를판정하고,다른하나는k -평균알고리즘을사용하여데이터를비슷한그룹들로군집화합니다。

dl-engineers-ebook-ch1-linear-reg-k-means

딥러닝이아닌이러한여러방법은논리를이해하기가대체로더쉽고비교적단순한데이터를소량으로사용한다는이점이있습니다。심층신경망을훈련할때는신경망이작동하는이유를설명하기어려울수있으며,신경망은훈련을위해고품질의레이블지정데이터가훨씬더많이필요합니다。그래도다른방법대신딥러닝을선택할이유는무엇일까?커다란해공간전반에걸쳐매우복잡한패턴을찾는데딥러닝이매우적합하기때문입니다。

예를들면,객체추적및위치추정을위해영상에서특정객체를찾아레이블을지정하려는경우나하드웨어의결함및재료손상을시각적으로검사하려는경우가있겠습니다。

dl-engineers-ebook-ch1-raw-data-identified-pattern
dl-engineers-ebook-ch1-concrete-damage

이예에서패턴은보행자나깨진콘크리트등을나타내는특정한픽셀의조합입니다。이런패턴은경우마다크게다를수있는복잡한패턴일수도있고,그차이가매우미세하여다른패턴과구분하기가거의불가능할수도있습니다。따라서사용자가선택하는알고리즘은이러한복잡한패턴을분류해야할뿐만아니라매우커다란해공간전반에걸쳐그작업을수행해야합니다。

복잡한패턴은상외의데이터에도존재합니다。오디오신호에서는발화된단어를인식해야할수도있고,몇초에불과한짧은소절만듣고노래를알아내야할수도있습니다。

예측정비응용분야나생물의학산업등에서볼수있는시계열신호에도복잡한패턴이있습니다。

面板的导航

딥러닝을사용한시계열예측

Lstm(장단기기억)신경망을사용한시계열데이터예측。

面板的导航

Lstm(장단기기억)신경망을사용한ecg신호분류

딥러닝및신호처리를사용한生理网2017年挑战의심박心电图(심전도)데이터분류。

面板的导航

웨이블릿분석및딥러닝을사용하여시계열분류하기

类(연속웨이블릿변환)및심층컨벌루션신경망을사용한인체心电图(심전도)신호분류。

이모든사례에서는해가존재하는복잡도와범위로인해사람이직접논리를만들고선별하는규칙기반접근방식을고안하기가어렵습니다。이럴때는딥러닝이더나을수있습니다。

참고:이电子书의예는이산레이블이데이터에적용되는분류에대해주로다룹니다。그러나딥러닝에서는모델의출력이이산레이블이아니라연속값이되는회귀도가능합니다。회귀를위해cnn(컨벌루션신경망)을훈련하는방법을알아보십시오。

딥러닝은심층신경망을사용하여입력데이터와출력분류간의관계를모델링합니다。신경망에대한자세한내용은이챕터에서다루지않지만,간단히신경망이란각각의계층이데이터에대한특정한연산을수행하는일련의계층으로구성된망이라고생각할수있습니다。앞쪽계층은더큰패턴안에있는작은특징을찾는경향이있고,이후의계층은이런특징의조합을보고데이터에맞는가장확률이높은레이블이무엇인지판별합니다。

dl-engineers-ebook-ch1-model-training-car
섹션

특징은패턴을정의하는데어떻게도움이될까?

딥러닝의이점그리고더큰패턴을인식하는데특징식별이어떻게도움이될지이해하기위해,가속도데이터에서하이파이브를인식할수있는알고리즘을개발해야한다고상상해보겠습니다。

아래플롯에서서로다른세개의팔동작에대한가속패턴을볼수있습니다。가운데플롯은하이파이브를나타냅니다。다른모든팔동작과하이파이브패턴을구분할수있는알고리즘을개발하려면어떻게접근해야할까요?

모든결정적특징을아는경우

우선이문제에대한간단한규칙기반접근방식부터찾아볼수있습니다。한가지방법으로는이미알려진하이파이브프로파일을사용하여센서로부터오는지속적인가속도측정값스트림에대해패턴매칭을수행하는것입니다。예를들면함수를통해두신호간의표준편차를확인하고편차가특정임계값아래로떨어질때하이파이브가발생했다고판별할수있습니다。

그러나이접근방식에는모든하이파이브가제각기다르다는난점이있습니다。사람에따라손을움직이는속도가빠르거나느릴수있고,손뼉을치기직전에잠시멈추거나특이한방식으로하이파이브를할수도있습니다。대표적인프로파일이나프로파일의집합을도출할수있다해도,이와같은접근방식으로는과거에본적이없는하이파이브동작을정확히인식하지못할수있습니다。또한모든하이파이브를확실히포착하려고프로파일을너무많이추가하거나표준편차임계값을높이면하이파이브가아닌동작에도하이파이브라고레이블을잘못지정할위험이생깁니다。

이문제에서는변동이심할수도있는패턴을전체적으로보기보다는모든하이파이브가공통적으로갖는작은특징의집합을찾을수있음을인지하는편이더현명한접근방식일것입니다。

데이터를명확하게수집하지않은새로운하이파이브를관찰하더라도가속이느림-느림-빠름으로조합된다면모두하이파이브라고주장할수있을지도모릅니다。예를들어다음의하이파이브는서로달라보이지만”느림——느림——빠름“이라는가속특징은동일하게나타납니다。

dl-engineers-ebook-ch1-high-five-graph-comparison

작은특징을찾아보고그특징이언제어떤순서로나타나는지살펴본다면,단순한전체패턴매칭알고리즘보다우수한규칙기반분류기를설계할수있습니다。

이와같은규칙기반분류기가갖는난점은누군가가정확한분류에필요한최적의특징을정의할수있으려면찾고있는패턴에대해매우잘알고있어야한다는점입니다。또한키작은사람,수줍음이많은사람,다른문화등에대해알고리즘이의도치않게편향되지않도록모든변동사항을확실히처리해두어야합니다。정말복잡한패턴은이작업을수작업으로하려고하면시간이오래걸리거나아예불가능할수도있습니다。

모든결정적특징을다알지는못하는경우

딥러닝이이런문제를해결할수있습니다。직관적이지않은특징마저포함하는다양한패턴특징이설계자의명시적정의없이도자동으로학습됩니다。따라서데이터의복잡한패턴을분류하려하지만이패턴을다른패턴과구분하는모든규칙을정의하기는불가능하다면딥러닝을통해효과적으로해결할수있을것입니다。

물론딥러닝에는나름의구사항이있다는점을염두에두어야합니다。레이블이지정된다량의고품질데이터와적절한신경망아키텍처가필요하며,이신경망을타겟프로세서에배포하고주어진시간안에실행할수있는지도확인해야합니다。이电子书의다음챕터에서는이러한电子书구사항을다룹니다。