머신러닝기법을사용하여알려진입력및응답데이터에서예측모델구축하기

지도학습은가장일반적인유형의머신러닝알고리즘입니다。지도학습은알려진데이터셋(훈련데이터셋)을사용하여알려진입력데이터(특징)및알려진응답변수의집합으로알고리즘을훈련해서예측을수행합니다。훈련데이터셋에는원하는출력또는응답변수값과쌍을이루는레이블지정된입력데이터가포함됩니다。지도학습알고리즘은훈련데이터셋에서특징과출력데이터간의관계를찾은후새로운데이터셋에대한응답변수값을예측하여모델을만들방안을모색합니다。

지도학습을적용하기전에종종비지도학습을사용해서입력데이터내패턴을발견해특징이될수있는후보를식별하고,특징엔지니어링을통해이런패턴을지도학습에더적합한형태로변환하게됩니다。특징외에도훈련세트내모든관측값에대한올바른범주또는응답도식별해야하는데,이는극히노동집약적인단계입니다。준지도학습을사용하면매우제한된레이블지정데이터만을사용해서모델을훈련할수있으므로레이블지정에드는노력이줄어듭니다。

알고리즘이훈련된다음에는훈련에사용되지않은테스트데이터셋을사용해서알고리즘의성능을예측하고검증하는경우가일반적입니다。정확한성능결과를얻기위해서는훈련세트와테스트세트가모두”현실”을잘반영하는것이중요합니다(즉,프로덕션환경과모델의데이터가모두올바르게검증된상태여야함)。

모델검증에대한问答

深度学习工具箱™统计和机器学习工具箱™를사용하여MATLAB®에서예측지도학습모델을훈련,검증,조정할수있습니다。

지도학습알고리즘범주

분류:데이터를특정클래스로구분할수있는범주형응답변수값에사용됩니다。이진분류모델에는두개의클래스가있고다중클래스분류모델은그이상의클래스수를갖습니다。MATLAB에서분류학습기앱을사용하여분류모델을훈련할수있습니다。

일반적인분류알고리즘에는다음이포함됩니다。

회귀:수치적연속응답변수값에사용됩니다。MATLAB에서회귀학습기앱을사용하여회귀모델을훈련할수있습니다。

일반적인회귀알고리즘에는다음이포함됩니다。

지도학습응용분야

지도학습은금융응용분야(신용평가,알고리즘트레이딩,채권분류)영상및비디오응용분야(객체분류및추적),산업응용분야(이상값감지),예측정비(장비수명추정),생물학응용분야(종양감지,신약개발),에너지응용분야(가격및부하예측)에사용됩니다。

참조:统计和机器学习工具箱深度学习工具箱머신러닝비지도학습演算法선형회귀비선형회귀데이터피팅데이터분석수학적모델링예측모델링인공지능AutoML정규화