이페이지의최신내용은아직번역되지않았습니다。최신내용은영문으로볼수있습니다。

모수적피팅

라이브러리모델을사용한모수적피팅

모수적피팅에서는데이터에피팅하는하나이상의모델에대한계수(파라미터)를찾는작업이수행됩니다。데이터는통계적성질을갖는다고간주되며,다음과같은2개의성분으로나뉩니다。

데이터=결정적성분+확률적성분

결정적성분은모수적모델로지정되고,확률적성분은종종데이터와연관된오차로설명됩니다。

데이터=모수적모델+오차

모델은독립변수(예측변수)와하나이상의계수에대한함수입니다。오차는특정확률분포(보통가우스분포)를따르는데이터의임의변동을나타냅니다。이런변동은여러요인에서기인할수있지만,측정된데이터를취급할때는항상어느정도존재합니다。체계적변동도존재할수있지만,이는데이터를제대로표현하지못하는피팅모델을야기할수있습니다。

모델계수는물리적유의성을갖는경우가많습니다。예를들어,방사성핵종의단일붕괴방식에해당하는데이터를수집하여붕괴의반감기(T1/2)를추정하려한다고가정하겠습니다。방사성붕괴법칙에서는방사성물질의활동이시간의흐름에따라지수적으로붕괴한다고설명합니다。따라서피팅에사용할모델은다음과같이지정됩니다。

ÿ = ÿ 0 Ë - λ Ť

여기서ÿ0t = 0은시간에서의핵의개수고λ는붕괴상수입니다。데이터는다음방정식으로설명할수있습니다。

数据 = ÿ 0 Ë - λ Ť + 错误

ÿ0과λ는모두피팅에의해추정되는계수입니다。Ť1/2= ln(2) /λ이므로붕괴상수의피팅된값은피팅된반감기를산출합니다。그러나데이터에일부오차가포함되어있으므로데이터로부터정확하게방정식의결정적성분을파악할수는없습니다。따라서계수및반감기계산에는어느정도의불확실성이수반됩니다。불확실성이허용가능한수준이라면여기서데이터피팅이완료됩니다。불확실성이허용가능하지않은수준이라면더많은데이터를수집하거나측정오차를줄이고새로운데이터를수집한후모델피팅을반복하는등불확실성을낮추는과정을수행해야할수있습니다。

모델을관장하는이론이없는여타문제에서는항을추가하거나제거하여모델을수정하거나완전히다른모델로대체해볼수도있습니다。

曲线拟合工具箱™의모수적라이브러리모델은다음섹션에설명되어있습니다。

대화형방식으로모델유형선택하기

곡선피팅앱의드롭다운목록에서피팅할모델유형을선택합니다。

곡선또는곡면에는어떤피팅유형을사용할수있을까요?선택한데이터에따라피팅범주목록에는곡선또는곡면범주가표시됩니다。다음표에서는곡선과곡면에대해사용가능한옵션을설명합니다。

피팅범주 곡선 곡면
회귀모델(回归模型)
다항식 가능(최대9차) 가능(최대5차)
지수 가능
푸리에 가능
가우스 가능
멱곱수 가능
유리 가능
사인합 가능
베이불 가능
보간(插值)
보간 가능
방법:
최근접이웃
선형
3차
형태보존(PCHIP)
가능
방법:
최근접이웃
선형
3차
쌍조화
박판스플라인
평활화(光滑)
평활화스플라인 가능
洛斯 가능
사용자지정(自定义)
사용자지정수식 가능 가능
自定义直线拟合 가능

모든피팅범주에서결과(结果)창을보면모델항,계수의값,적합도통계량을확인할수있습니다。

피팅에문제가있을경우결과(结果)창의메시지를참고하여더나은설정을찾아낼수있습니다。

피팅설정선택하기

곡선피팅앱에서는피팅을개선하기위해변경할수있는일련의피팅유형및설정을제공합니다。먼저디폴트값을사용해본다음다른설정으로시험해보십시오。

사용가능한피팅옵션을사용하는방법에대한개요는피팅옵션및최적화된시작점지정하기항목을참조하십시오。

하나의피팅图내에서여러설정을시도해볼수도있고,여러피팅을만들어서비교해볼수도있습니다。여러피팅을만든경우에는곡선피팅앱에서여러피팅유형과설정을나란히비교할수있습니다。创建多个适合的曲线拟合应用程序항목을참조하십시오。

프로그래밍방식으로모델유형선택하기

适合함수를호출할때라이브러리모델이름을문자열로지정할수있습니다。예를들어2차식poly2를지정하려면다음을입력하십시오。

f = fit(x, y, 'poly2')

사용가능한모든라이브러리모델이름을보려면곡선과곡면피팅라이브러리모델목록항목을참조하십시오。

fittype함수를사용하여라이브러리모델에대한fittype객체를생성하고,fittype适合함수에대한입력값으로사용할수도있습니다。

설정할수있는파라미터를확인하려면fitoptions함수를사용하십시오。예를들면다음과같습니다。

fitoptions(POLY 2)

다른예를보려면대화형방식으로모델유형선택하기에나와있는표에서각모델유형의섹션을참조하십시오。모델생성및분석에사용되는모든함수에대해자세히알아보려면曲线曲面拟合항목을참조하십시오。

정규화사용하기

곡선피팅앱의모델유형대부분은정규화(归一化)옵션을공유합니다。이옵션을선택하면툴은변수에正常化설정을적용하여정규화된데이터로다시피팅합니다。명령줄에서는正常化fitoptions함수에대한입력인수로사용할수있습니다。fitoptions함수도움말페이지를참조하십시오。

일반적으로입력값(예측변수데이터라고도함)은정규화하는것이좋습니다。이렇게하면크기가서로다른변수의수치적문제를완화할수있습니다。예를들어,곡면피팅입력값이500 ~ 4500 r / min범위내의엔진속도이고0 ~ 1범위내의엔진부하백분율이라고가정하겠습니다。두입력값사이의크기차이가상당히크기때문에,정규화(归一化)를사용하면피팅이대체로개선됩니다。그러나입력값의단위나크기가같은경우(예:지리데이터의동방위와북방위)에는정규화(归一化)의유용함이줄어듭니다。이옵션을사용하여입력값을정규화하면피팅된계수의값은원래데이터에비해달라집니다。

곡선또는곡면을피팅하여계수를추정하는경우나계수에물리적유의성이있는경우에는정규화(归一化)체크박스의선택을취소하십시오。곡선피팅앱의플롯은정규화(归一化)옵션이설정된경우나설정되지않은경우모두원래척도를사용합니다。

명령줄에서피팅전에데이터정규화옵션을설정하려면디폴트合适的选择구조체를만들고正常化으로설정한후다음이옵션을사용해피팅하십시오。

选择= fitoptions;options.Normal '上'=;'上' 排除::选择选项=规格化[1X0双]重量:[1X0双]方法: '无' 负载人口普查F1 =拟合(CDATE,POP, 'POLY3',选项)

피팅옵션및최적화된시작점지정하기

피팅옵션소개

대화형방식피팅옵션은이어지는섹션에설명되어있습니다。동일한피팅옵션을프로그래밍방식으로지정하려면명령줄에서피팅옵션지정하기항목을참조하십시오。

곡선피팅앱에서대화형방식으로피팅옵션을지정하려면피팅옵션(合适的选项)버튼을클릭하여피팅옵션대화상자를여십시오。보간과평활화스플라인을제외한모든피팅범주에는구성가능한피팅옵션이있습니다。

사용가능한옵션은선형모델,비선형모델,비모수적피팅유형중어느것을사용하여데이터를피팅하는지에따라달라집니다。

  • 다음에서설명하는모든옵션은비선형모델에서사용가능합니다。

  • 다항식선형모델대화상자에서사용가능한유일한피팅옵션은하한상한계수제약조건입니다。다항식의경우피팅옵션대화상자를열지않고곡선피팅앱에서로버스트(强大)를설정할수있습니다。

  • 비모수적피팅유형(보간,평활화스플라인및洛斯)에는추가적인피팅옵션대화상자가없습니다。

단일항지수의피팅옵션이다음에나와있습니다。계수시작값과제약조건은인구조사데이터에해당하는것입니다。

피팅방법과알고리즘

  • 방법(方法)——피팅방법。

    방법은사용하는라이브러리또는사용자지정모델에따라자동으로선택됩니다。선형모델의경우방법은LinearLeastSquares입니다。비선형모델의경우방법은NonlinearLeastSquares입니다。

  • 로버스트(强大)- - - - - -로버스트최소제곱피팅방법을사용할지여부를지정합니다。

    • - 로버스트피팅을사용하지않습니다(디폴트값)。

    • - 디폴트로버스트방법을사용하여피팅합니다(겹제곱가중치)。

    • 守护神(최소절대잔차(政治)를최소화하여피팅합니다。

    • Bisquare——잔차의제곱합을최소화하여피팅하고,겹제곱가중치를사용하여이상값가중치를줄입니다。대부분의경우이는로버스트피팅에서가장좋은선택입니다。

  • 알고리즘(算法)——피팅절차에사용되는알고리즘:

    • 信任区域——디폴트알고리즘으로,하한또는상한계수제약조건을지정한경우반드시이를사용해야합니다。

    • 文伯格 - 马夸特- 信赖域알고리즘이적절한피팅을생성하지못하고계수제약조건이없는경우文伯格 - 马夸特알고리즘을시도해보십시오。

유한차분파라미터

  • DiffMinChange- 유한차분야코비행렬에대한계수의최소변화량입니다。디폴트값은108입니다。

  • DiffMaxChange——유한차분야코비행렬에대한계수의최대변화량입니다。디폴트값은0.1입니다。

DiffMinChangeDiffMaxChange는다음방정식에적용됩니다。

  • 모든비선형사용자지정수식(즉사용자가작성한비선형방정식)

  • 曲线拟合工具箱에서제공하는일부비선형방정식

반면DiffMinChangeDiffMaxChange는선형방정식에적용되지않습니다。

피팅수렴조건

  • MaxFunEvals- 허용되는함수(모델)실행의최대횟수입니다。디폴트값은600입니다。

  • 麦克斯特——허용되는피팅반복의최대횟수입니다。디폴트값은400입니다。

  • TolFun——함수(모델)값과연관된중지조건에사용되는종료허용오차입니다。디폴트값은106입니다。

  • TolX——계수와연관된중지조건에사용되는종료허용오차입니다。디폴트값은106입니다。

계수파라미터

  • 계수(系数)- 피팅할미지의계수에대한기호입니다。

  • 시작점(起点)- 계수시작값입니다。디폴트값은모델에따라달라집니다。유리,베이불및사용자지정모델의경우디폴트값은[0,1]범위내에서임의로선택됩니다。다른모든비선형라이브러리모델의경우시작값은데이터세트에따라달라지며발견적방식으로계산됩니다。아래의최적화된시작점을참조하십시오。

  • 하한(下限)- 피팅된계수의하한입니다。이툴은信赖域피팅알고리즘에서만한계를사용합니다。대부분의라이브러리에서디폴트하한은-Inf입니다。이는계수에제약조건이없음을나타냅니다。그러나유한디폴트하한을갖는모델도소수있습니다。예를들어,가우스모델에는너비파라미터가0보다작을수없다는제약조건이있습니다。아래의디폴트제약조건을참조하십시오。

  • 상한(上限)- 피팅된계수의상한입니다。이툴은信赖域피팅알고리즘에서만한계를사용합니다。모든라이브러리에서디폴트상한은입니다。이는계수에제약조건이없음을나타냅니다。

이러한피팅옵션에대한자세한내용은优化工具箱™문서의lsqcurvefit함수를참조하십시오。

최적화된시작점및디폴트제약조건

다음표에는라이브러리및사용자지정모델에대한디폴트계수시작점과제약조건이나와있습니다。시작점이최적화된경우에는현재데이터세트에따라발견적방식으로계산됩니다。[0,1]구간내에임의의시작점이정의되며,선형모델에는시작점이필요하지않습니다。

모델에제악조건이없는경우,계수는하한도상한도갖지않습니다。피팅옵션대화상자를사용하여사용자고유의값을제공하면디폴트시작점과제약조건을재정의할수있습니다。

디폴트시작점및제약조건

모델

시작점

제약조건

사용자지정선형

해당사항없음

없음

사용자지정비선형

임의

없음

지수

최적화됨

없음

푸리에

최적화됨

없음

가우스

최적화됨

C一世> 0

다항식

해당사항없음

없음

멱급수

최적화됨

없음

유리

임의

없음

사인합

최적화됨

b一世> 0

베이불

임의

的a,b> 0

사인합모델과푸리에급수모델은특히시작점에민감하며,최적화된값은관련방정식에서몇개항에대해서만정확할수있음을유의하십시오。

명령줄에서피팅옵션지정하기

피팅전에디폴트合适的选择구조체를만들고데이터를정규화하도록옵션을설정합니다。

选择= fitoptions;options.Normal '上'=;options = Normalize: 'on'排除:[1x0 double]权值:[1x0 double]方法:'None'

正常化排除또는权重필드를설정한후다른피팅방법에동일한옵션을사용하여데이터를피팅하려는경우디폴트合适的选择구조체를수정하는것이편리합니다。예를들어,다음과같이입력합니다。

load census f1 = fit(cdate,pop,'poly3',options);f2 =适合(cdate、流行、“exp1”,选项);f3 =适合(cdate、流行、“cubicsp”,选项);

适合함수의세번째출력인수로데이터종속적인피팅옵션이반환됩니다。예를들어,평활화스플라인의평활화파라미터는데이터종속적입니다。

(f, gof) =适合(cdate、流行、“平滑”);smoothparam =。p smoothparam = 0.0089

피팅옵션을사용하여새피팅에대한디폴트평활화파라미터를수정합니다。

选择= fitoptions(“方法”,“顺利”,“SmoothingParam”, 0.0098);(f, gof) =适合(cdate、流行、“平滑”,选项);

피팅옵션을사용하는방법에대한자세한내용은fitoptions함수도움말페이지를참조하십시오。