主要内容

このページの翻訳は最新ではありません。ここをクリックして、英語の最新版を参照してください。

回帰に NCAを使用するロバスト特徴選択

カスタムなロバスト損失関数を NCAで使用して、外れ値に対してロバストな特徴選択を実行します。

外れ値があるデータの生成

3.つの予測子 (予測子 4、7 および 13) に応答が依存する回帰用の標本データを生成します。

rng(123,“龙卷风”)%用于重现N = 200;X = randn(N,20);Y = COS(X(:,7))+ SIN(X(:,4)* X(:,13))+ 0.1 * randn(N,1);

外れ値をデータに追加します。

numoutliers=25;outlieridx=floor(linspace(10,90,numoutliers));y(outlieridx)=5*randn(numoutliers,1);

データをプロットする。

图绘图(y)

图包含轴。轴包含类型线的对象。

非ロバストな損失関数の使用

特徴选択アルゴリズムの性能は,正则化パラメーターの値に大きく依存します。特徴选択での使用に最も适している値になるように正则化パラメーターを调整することをお勧めします0.5分割交差検证を使用して正则化パラメーターを调整します。平均二乘误差(MSE)を使用します。

MSE = 1. N = 1. N ( Y - Y J ) 2.

はじめに、データを 5.つの分割に分割します。各分割で、データの 4/5 は学習に、1/5 は検証 (検定) に使用されます。

cvp = cvpartition(长度(y),“kfold”,5);numtestsets=cvp.numtestsets;

検定するラムダ値を計算し、損失値を格納する配列を作成します。

lambdavals = linspace(50 0 3) *性病(y) /长度(y);lossvals = 0(长度(lambdavals), numtestsets);

NCAを実行し,各 λ 値および各分割について損失を計算します。

对于i = 1:长度(lambdavals)对于Xtrain = X(cvp.training(k),:);ytrain = y (cvp.training (k):);Xtest = X (cvp.test (k):);欧美= y (cvp.test (k):);nca = fsrnca (Xtrain ytrain,“FitMethod”,“准确”,...“规划求解”,“lbfgs”,“冗长”,0,“拉姆达”lambdavals(我),...“失去功能”,'妈妈');损失(i,k)=损失(nca,xtest,ytest,“失去功能”,'妈妈');终止终止

各ラムダ値に対応する平均損失をプロットします。

figure meanloss=平均值(lossvals,2);绘图(lambdavals,meanloss,'ro-')包含(“拉姆达”) ylabel (‘损失(MSE)’) 网格

图包含轴。轴包含类型线的对象。

平均損失が最小になる λ の値を求めます。

[〜,IDX] =分钟(平均值(lossvals,2));bestlambda = lambdavals(IDX)
最佳λ=0.0231

最良の λ 値および 微卫星を使用して特徴選択を実行します。

nca = fsrnca (X, y,“FitMethod”,“准确”,“规划求解”,“lbfgs”,...“冗长”,1,“拉姆达”,bestlambda,“失去功能”,'妈妈');
o解算器=LBFGS,HessianHistorySize=15,第二个月第二个月第二个月第二个月第二个月第二个月第第二个月第第二个月第第二个月第第二个月第第二个月第第二个月第二个月第二个月第二个月第二个月第二个月第二个月第二个月第二个月第二个月第二个月第二个月第二个月第二个月第二个月第二个月第二个月第二个月第二方方方方方方方方方方方方将将将将将为为为第二周周周周周周周周周周周周周周周周周第第第二方方方方方方方方方方方方方方方方方方方第第第第第1 1 1 1 1 1 7 7 7 7周周周周周周周周周周周周周周周周周第第第第第第第第第第第第第第第第第第第第第第第=============================================================================================================================================================================================================================================0 | 6.414642e+00 | 8.430e-01 |0.0 0 0.0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 4.6 6 6 6.066100e+0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 4.952e-0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 E-0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1.108548e+00 | 3.933e-01 | 8.564e-01 |正常| 3.599e-01 | 1.000e+00 |是| 4 | 4.808456e+00 | 2.505e-01 | 9.352e-01 |正常| 8.798e-01 |2.085e-01 1246.014e-01 6.014e-01 4.014e-01 1246.014e-014 E-01“OK”OK 12444.1.052 E+0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 \124;是,是,是,是的第四4.4.7 7 7 7.677 7 7 7 7.7373737 7 7 7 7 7 7 7 7 7 7.7-0 0 0 0 0 0 0 0-0 0 0 0-0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0-01号E-01号E-01 \1244.7.7.7 7-1-7-7 7.4-7.4 4 4-7 7 7-4 4 4 4 4 4-124; 4.253e-01 | OK | 3.367e-01 | 1.000e+00 |是| 8 | 4.258539e+00 | 3.629e-01 | 4.705e-01 |是| 9 |4.018e-01“4.018”E-01“4.018 E-01”4.018 E-01“4.018 E-01”4.018 E-01“1.000e+0 0 0 0 0 0 0 0 0 0 E+00 12444 4 4.5 5 5 5 5 5+00 1244四四四四四四四四四四四四四四四四四四五五5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 \\12444 4四四四四四四四四四四四四四四四四四四四四四四四四四四四四四四四四四四四四四四四四四四四四四四四四四。1.1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 124; 1.000e+00 |是| 12 | 4.059690e+00 | 1.584e-01 | 5.213e-01 |好| 9.930e-01 | 1.000e+00 |是| 13 | 4.029208e+00 | 7.411e-02|2.0.7 7.7 7.6 E-0 0 0 0 0 0 0 0 0 0 0 0 0 0 0“是的”2.0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.7 7 7 7 7 7.7 7 7 7 7 7 7 7 7 7 6 6 6.7 7 6 6 6 6 6 6 6 6.6 6 6 6 6 E-0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 16 | 3.986929e+00 | 6.158e-02 | 2.993e-01 |好| 1.353e+00 | 1.000e+00 |是| 17 | 3.976342e+00 | 4.966e-02 | 2.213e-01 |好|7.6.6 6.6 6 6 6 6 6 6 6 6 6 6 6 6 E+00 5.458 E-0 2.5 5 5 8 8 E-2 2.5 5 8 8 8 8 8 E-0 0 0 0 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 E-0 0 1.6 8 8 8 E-0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7.6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 8 8 8 8 8 8 8 8 8 8 8 8 8 8 E-5 5 5 5 5 5 5 5 8 8 8 8 8 8 8 8 8 8 E-5 5 5 5 5 5 5 5 5 5 5 5 8 8 8 8 8 8 8 E-5 5 5 5 8 8 8 8 8 8 8 8 8 8 8 8 8 8 E-0 5 5 5 5 5 5 5============================================================================================================================================================国际热核实验堆|乐趣价值|标准梯度|标准阶梯|曲线|第二方第=====================第第二方第第二方第第二方第第二方第第二方第第二方第第第第二方第第第二方第第二方第第第二方第第二方第二方第二方第二方第二方第二方第二方第二方第二方第二方第二方第二方第二方第第二方第二方第第第二方第礼礼礼礼礼礼礼第第第第第第第第第第第第第第二方第二方第二方第第第二方第二方第第第第第第第二方第礼礼礼礼礼礼第第第第第第第第第第二方第第第第第第第二方第第第第第二方第二方第第第第第第第第二方第第第第第第二方第第第第第第二方第礼礼礼礼礼礼第第第第第第第第第第第第第第第第|21 | 3.945475e+00 | 3.119e-02 | 1.698e-01 |好| 1.095e+00 | 1.000e+00 |是| 22 | 3.941567e+00 | 2.350e-02 | 1.293e-01 |好|3.939468e+0 0 0 4.1 6 E-1.296e-0 0 0 1.6 E-2 1.805e-0 0 1.805e-0 0 1.805e-0 0 1 1.805e-01“OK”1.805e-01“OK”OK,2.287e+0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0;6.421e-03 | 5.334e-02 |正常| 1.102e+00 | 1.000e+00 |是| 26 | 3.938013e+00 | 5.449e-03 | 6.773e-02 |正常| 2.085e+00 | 1.000e+00 |3.368e-02|3.66E-02𞓜;4.4 4个E-02よOKよ7.541e-01よ1244よ; 7.541e-01124四四四四四四四四四号124;124周四周四周四124;;; 7号号号124四四四四四四四四四四四四四四四四四四四四四四四四四四四四四四四个州州\\\|;;;;;;;; 7 7号号号号号号号号号号号号号7 7 7 7 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6.3.3.3.4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 124; OK | 1.863e+00 | 1.000e+00 |是| 30 | 3.937784e+00 | 2.448e-03 | 1.265e-02 | OK | 9.667e-01 | 1.000e+00 |是| 31 | 3.9377E+00|6.6.7 7 7.7 7 7.3 3 E-6.7 7 7.3 3 3.3 3 3.3 E-3.7 7 6.7 7 7.7 7 7.3 3.3.3 3.3 3.3.3.7 7 7 7.3 3.3.7 7 3.7 7 E-4 4 4 4 4 4.3.6.6 6 6.7 E-0 0 0 0 0 0 E-0 0 0 0 0 0 0 0 E+0 0 0 0 0 0 0 0 0个E+0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0\\12412412444“是””和3“是“是”和3.3“是”和3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3|是| 34 | 3.937777e+00 | 1.959e-04 | 1.537e-03 |好| 4.026e+00 | 1.000e+00 |是| 35 | 3.9377E+00 | 1.162e-04 | 1.464e-03 |3.93777 E+0 0 |; 3.93777 E+0 0 | 3.93777 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7.3 3 3 E-05 | 3.3 3 3 3.3 3 3 3 3.415 5 E-5 5 5 5 5 5 5 5 5 5| 3.3.413 3 3 E-5 5124四四四四四四四四四四四个“3.3.3.6 6 6 6 6 6 6 5 5 5 5 5 5 5”E-3.3.6 6个E-5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5“3.3.3.6 6 6 6 6 6 6 6个E-5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 00 | 1.277e-05 | 3.808e-05 |正常| 1.021e+00 | 1.000e+00 |是| 39 | 3.9377E+00 | 8.614e-06 | 3.698e-05 |正常| 2.561e+00 |1.0月1.0月1.0月1.0月1.0月1.0月1.0月1.0月1.0月1.0月1.0月1.0月1.0月1.0月1.0月1.0月1月1.0月1.0月1.0月1.0月1日“是”的“是”的“是”的“是”的“是”的”的第1.0月1.0月1月1.0月1月1月1月1日第1月1月1.0月1月1月1月1月1日第1日,第1月1月1月1比比比比第1月1月1月1月1月1月1月1月1月1第1月1月1第1第1第1第1第1月1第1第1第1月1月1月1月1月1月1第1第1第1第1第1第1第1第1第1第1第==============================================================================================================================================================================================================================40 | 3.937777e+00 | 3.159e-06 | 5.299e-05 | OK|4.3.37777 E+00 12444.3.7 7 7 E-7.7 7 E-7 7.036e-7 7.036e-7 7.036e-06 1244.1.080e-0 0 0 0 0 0 0 0 0 5 12400 0 0 0 0 0 0 0 0 0 0 0 0 0 5 12400 0 12400 0 0 0 12400 0 0 0 0 12444 4.4.0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 E-0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0步骤=7.036e-06,TolX=1.000e-06最终梯度的相对无限范数=7.054e-07,TolFun=1.000e-06出口:找到局部最小值。

選択した特徴量をプロットします。

图表(nca.FeatureWeights,“罗”) 网格Xlabel(“功能索引”) ylabel (“功能重量”)

图包含轴。轴包含类型线的对象。

NCA.モデルを使用して応答値を予測し,あてはめた(予測した)応答値と実際の応答値をプロットします。

Figts fited =预测(NCA,x);绘图(Y,“r.”)举行情节(安装,“b -”)包含(“索引”) ylabel (“拟合值”)

图中包含一个轴。该轴包含两个类型为line的对象。

FSRNCAは、外れ値を含むデータ内のすべての点をあてはめようとします。この結果、予測子 4、7 および 13以外の多くの特徴量に非ゼロの重みが割り当てられます。

組み込みロバスト損失関数の使用

同じプロセスを繰り返して正則化パラメーターを調整します。今回は、組み込みの ϵ 許容損失関数を使用します。

L ( Y , Y J ) = 最大限度 ( 0 , | Y - Y J | - ϵ )

ϵ 许容损失关数は平均二乘误差よりも外れ値に対してロバストです。

lambdavals = linspace(50 0 3) *性病(y) /长度(y);cvp = cvpartition(长度(y),“kfold”,5);numtestsets=cvp.numtestsets;lossvals = 0(长度(lambdavals), numtestsets);对于i = 1:长度(lambdavals)对于Xtrain = X(cvp.training(k),:);ytrain = y (cvp.training (k):);Xtest = X (cvp.test (k):);欧美= y (cvp.test (k):);nca = fsrnca (Xtrain ytrain,“FitMethod”,“准确”,...“规划求解”,“新加坡元”,“冗长”,0,“拉姆达”lambdavals(我),...“失去功能”,‘ε敏感’,“ε”, 0.8);损失(i,k)=损失(nca,xtest,ytest,“失去功能”,'妈妈');终止终止

使用する ϵ の値はデータによって異なり、最良の値を決定するには交差検証も使用することになります。しかし、 ϵ の値の選択はこの例の範囲外です。この例における ϵ の選択は、主にこの方法のロバスト性を示すためのものです。

各ラムダ値に対応する平均損失をプロットします。

figure meanloss=平均值(lossvals,2);绘图(lambdavals,meanloss,'ro-')包含(“拉姆达”) ylabel (‘损失(MSE)’) 网格

图包含轴。轴包含类型线的对象。

平均损失が最小になるラムダの値を求めます。

[〜,IDX] =分钟(平均值(lossvals,2));bestlambda = lambdavals(IDX)
最佳λ=0.0187

ϵ 許容損失関数と最良のラムダの値を使用して近傍成分分析モデルをあてはめます。

nca = fsrnca (X, y,“FitMethod”,“准确”,“规划求解”,“新加坡元”,...“拉姆达”,bestlambda,“失去功能”,‘ε敏感’,“ε”, 0.8);

選択した特徴量をプロットします。

图表(nca.FeatureWeights,“罗”) 网格Xlabel(“功能索引”) ylabel (“功能重量”)

图包含轴。轴包含类型线的对象。

あてはめた値をプロットします。

Figts fited =预测(NCA,x);绘图(Y,“r.”)举行情节(安装,“b -”)包含(“索引”) ylabel (“拟合值”)

图中包含一个轴。该轴包含两个类型为line的对象。

ϵ 許容損失は、外れ値に対するロバスト性が高いようです。関連性があると識別された特徴量の数が 微卫星より少なくなっています。このあてはめでは、依然として一部の外れ値の影響があることが示されています。

カスタムなロバスト損失関数の使用

外れ値に対してロバストであるカスタムなロバスト損失関数を定義し、回帰用の特徴選択で使用します。

F ( Y , Y J ) = 1. - 经验 ( - | Y - Y J | )

customlosscn=@(yi,yj)1-exp(-abs(yi-yj'));

カスタム定義したロバスト損失関数を使用して正則化パラメーターを調整します。

lambdavals = linspace(50 0 3) *性病(y) /长度(y);cvp = cvpartition(长度(y),“kfold”,5);numtestsets=cvp.numtestsets;lossvals = 0(长度(lambdavals), numtestsets);对于i = 1:长度(lambdavals)对于Xtrain = X(cvp.training(k),:);ytrain = y (cvp.training (k):);Xtest = X (cvp.test (k):);欧美= y (cvp.test (k):);nca = fsrnca (Xtrain ytrain,“FitMethod”,“准确”,...“规划求解”,“lbfgs”,“冗长”,0,“拉姆达”lambdavals(我),...“失去功能”,CustomLossCn);lossvals(i,k)=损失(nca,Xtest,ytest,“失去功能”,'妈妈');终止终止

各ラムダ値に対応する平均損失をプロットします。

figure meanloss=平均值(lossvals,2);绘图(lambdavals,meanloss,'ro-')包含(“拉姆达”) ylabel (‘损失(MSE)’) 网格

图包含轴。轴包含类型线的对象。

平均損失が最小になる λ の値を求めます。

[〜,IDX] =分钟(平均值(lossvals,2));bestlambda = lambdavals(IDX)
最佳λ=0.0165

カスタムなロバスト损失关数と最良の λ の値を使用して特徴选択を実行します。

nca = fsrnca (X, y,“FitMethod”,“准确”,“规划求解”,“lbfgs”,...“冗长”,1,“拉姆达”,bestlambda,“失去功能”,香港海关(sfcn);
o Solver=LBFGS,HessianHistorySize=15,LineSearchMethod=weakwolfe |=========================================================================================================================================================接受阿尔法-伽玛-标准阶阶数|================================================================================================4.921e-02 0.000e+00 |124四四四四周四周四周四周四周四周四周四周四周四周四周四周四周四周四周四周四周四周四周四周四周四周四周四周四周四周四周四周四周四周四周四\\124四四四四四四四周四周四周四周四周四周四周四周四周四周四周四周四\124四四四四四四四四周四周四周四周四周四周四周四周四\\\周四周四周四周四周四周四周四周四周四周四周四周四周四周四0 0 0 0 0 0 0 0 0 0 0\\124四四四四四四四四四四四四四四四四四四四四四四四四四周四周四周四周四周四周四周四周四周四周四周四周四周四周四周四周四周四0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 124; 2.541e+01 | 1.000e+00 |是| 3 | 5.677090e-01 | 2.666e-02 | 7.583e-01 |好| 1.092e+01 | 1.000e+00 |是| 4 | 5.620806e-01 | 5.5243.3 3.3 e+0 0 0 0.000e+0 0 0 124; 3.3 3 3 e+0 0 0 0 0 0 0|是| 3 3.3 3 3.3 3 3.3 3 3 3.3 3 3 3.3 3 3 3 3 3 e-0 0 0 0 0 0 0-3 3 3 3 3 3.3 3 3 3 3 3 3 3 e-0 0 0 0 0 0 0 0 0 0 0 0 e+0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 \1244 \1244124;是是是1244|是是12441244| 5| 5 | 5 5 5 5 5 5 5 5 51244\1244124; 5| 5 5 5 5 5 5 5 51244124四四四四四| 7 | 5.614653e-01 | 4.118e-04 | 2.466e-02 |好| 2.105e+01 | 1.000e+00 |是| 8 | 5.614620e-01 | 1.307e-04 | 1.373e-02 |好| 2.0025.614615e-01 9.318 e-05 9.318 8 e-5 4.128e-5 4.128e-3 4.128e-0312444 4.128e-3“OK”0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0-05 | 1.582e-03 | OK | 2.000e+01 | 5.000e-01 |是| 12 | 5.614610e-01 | 3.174e-06 | 4.742e-04 | OK | 2.510e+01 | 1.000e+00 |是||13 | 5.614610e-01 | 7.896e-07 | 1.683e-04 | OK | 2.959e+01 | 1.000e+00 |是|最终梯度的无穷大范数=7.896e-07最后一步的两个范数=1.683e-04,TolX=1.000e-06最终梯度的相对无穷大范数=7.896e-07,TolFun=1.000e-06出口:找到局部最小值。

選択した特徴量をプロットします。

图表(nca.FeatureWeights,“罗”) 网格Xlabel(“功能索引”) ylabel (“功能重量”)

图包含轴。轴包含类型线的对象。

あてはめた値をプロットします。

Figts fited =预测(NCA,x);绘图(Y,“r.”)举行情节(安装,“b -”)包含(“索引”) ylabel (“拟合值”)

图中包含一个轴。该轴包含两个类型为line的对象。

このケースでは,损失が外れ値の影响を受けておらず,结果はほとんどの観测値に基づいています。FSRNCAは予測子 4、7 および 13を関連性がある特徴量として識別しており、他の特徴量は選択していません。

损失关数の选択が结果に影响を与える理由

はじめに、2.つの観測値の差について一連の値の損失関数を計算します。

deltay=linspace(-10,101000)';

カスタム損失関数の値を計算します。

customlossvals = customlossfcn(deltay,0);

イプシロン不感応損失関数および値を計算します。

ε=@(yi,yj,E)max(0,abs(yi-yj')-E);epsinsenvals=epsinsensitive(deltay,0,0.5);

微卫星損失関数および値を計算します。

MSE = @(yi,yj)(yi-yj')。^ 2;Msevals = MSE(Deltay,0);

次に,各損失関数をプロットして,これらの違いおよびこれらが結果に影響を与える理由を調べます。

图形绘图(德尔泰、customlossvals、,“g-”,德尔泰,爱普森瓦尔斯,“b -”,Deltay,Msevals,“r-”)包含("(yi-yj)") ylabel (‘损失(yi,yj)’)传奇(“海关损失”,‘ε敏感’,'妈妈')ylim([0 20])

图包含轴。轴包含型线的3个对象。这些对象代表customloss,epsiloninsensitive,MSE。

微卫星は、2.つの応答値の差が大きくなると二次関数的に大きくなり、外れ値の影響を大きく受けます。FSRNCAがこの損失を最小化しようとすると、より多くの特徴量を関連性があると識別することになります。イプシロン不感応損失は 微卫星より外れ値に対する耐性が高くなっていますが、結果的には 2.つの観測値の差が大きくなるとそれに比例して大きくなります。ロバスト損失関数は、2.つの観測値の差が大きくなると 1.に近づき、差がさらに大きくなっても値はあまり変化しません。3.つの中で外れ値に対して最もロバストです。

参考

||||

关键词トピック