このページの翻訳は最新ではありません。ここをクリックして、英語の最新版を参照してください。
kfoldedge
学習で使用しない観測値の分類エッジ
说明
入力引数
CVMdl
-交差検证のバイナリ线モデルモデル
分类区
モデルオブジェクト
交差検证バイナリ线形。。分类区
モデルオブジェクトとして指定します。分类区
モデルオブジェクト作成するに,,F一世tclinear
を使用し、交差検証用の名前と値のペアの引数のいずれか 1 つ (杂交
など)を指定ます。
名前と値引数
オプションの名称,价值
引数の区ペアを指定し。。Name
は引数名,价值
は対応するです。Name
は引用でなければなりませ。。Name1,Value1,...,NameN,ValueN
のに复数名前とのペア引数を任意の顺番で指定指定ます。。。
折
-分类スコア予测にする分割のインデックス
1:cvmdl.kfold
(既定)|正の整数の数値ベクトル
分类スコア予测にする分割のインデックス。“折叠”
と正の整数の数値ベクトルから構成されるコンマ区切りのペアとして指定します。折
の要素は1
からCVMdl.KFold
の範囲でなければなりません。
例:“折叠”,,,,[1 4 10]
データ型:single
|double
模式
-エッジの集約レベル
'平均'
(既定)|'个人'
エッジの集約レベル。'模式'
と'平均'
または'个人'
から构成コンマ区のペアとしてし。。。
値 | 说明 |
---|---|
'平均' |
分割全体平均し分类エッジを返す |
'个人' |
各分割分类エッジを返す |
例:“模式”,“个人”
出力引数
e
- 交差検证済み分类エッジ
数値スカラー | 数値ベクトル | 数値行列
例
k分割交検证エッジの推定
NLP のデータセットを読み込みます。
加载NLPDATA
X
は予测子のスパース行列,y
分类ベクトルベクトルです。データデータはははつつをクラスがが。。。
モデルでは,あるWebページの単語数が统计和机器学习一世ng Toolbox™ ドキュメンテーションによるものであるかどうかを識別できなければなりません。したがって、Statistics and Machine Learning Toolbox™ のドキュメンテーション Web ページに対応するラベルを識別します。
ystats = Y =='stats';
web webページの数ががががががががが数単语ドキュメンテーションドキュメンテーションものであるかかか识别できるバイナリ线形分类分类モデルモデルのの交差交差
rng(1);% For reproducibilityCVMdl = fitclinear(X,Ystats,“横瓦尔”,,,,'上');
CVMdl
は分类区
10分割,,,,分割分割が実行され。。'KFold'
名前とペア引数を使用し数を変更でき。。
分割外エッジ平均を推定し。。
e= kfoldedge(CVMdl)
e=8。1243
あるいは,kfoldedge
内のと値の引数引数“模式”,“个人”
を指定こと各分割を取得できます。
k分割エッジを使用した特徴選択
特徴選択を実行する方法の 1 つは、複数のモデルのk分割エッジするです。条件にとエッジがが最高となる分类分类器がが最善の分类分类器器
NLP のデータセットを読み込みます。k分割交検证の推定で说明れいるにデータを处理します。
加载NLPDATAystats = Y =='stats';x = x';
2つのセット作成し。。
FullX
にはの予测子含まれます。Partx
1/2がのののににに选択しがが含まれます。
rng(1);% For reproducibilityp = size(X,1);% Number of predictorsHalfPredIdx = randsample(p,ceil(0.5*p));fullx = x;partx = x(halfpredidx,:);
2つのバイナリ線形分類モデルを交差検証します。1 つではすべての予測子を、もう 1 つでは半分の予測子を使用します。観測値が列に対応することを指定し、SpaRSA を使用して目的関数を最適化します。
cvmdl = fitclinear(fullx,ystats,“横瓦尔”,,,,'上',,,,“求解器”,,,,'sparsa',,,,。。。'ObservationsIn',,,,'列');pcvmdl = fitclinear(partx,ystats,“横瓦尔”,,,,'上',,,,“求解器”,,,,'sparsa',,,,。。。'ObservationsIn',,,,'列');
CVMdl
およびPCVMDL
は分类区
モデルです。
各分类器についてk分割エッジ推定します。
FullEdge = kfoldEdge(CVMdl)
FullEdge = 16.5629
partEdge = kfoldedge(PCVMDL)
partEdge = 13.9030
k分割エッジすべて予测子をする分类の方モデルとして优れています。
klassoなペナルティペナルティペナルティペナルティペナルティペナルティ特定特定
lassoペナルティたたたペナルティペナルティペナルティペナルティペナルティ强度强度决定,,,,,,,,
NLP のデータセットを読み込みます。k分割交検证の推定で说明れいるにデータを处理します。
加载NLPDATAystats = Y =='stats';x = x';
~ の範囲で対数間隔で配置された 11 個の正則化強度を作成します。
lambda = logspace(-8,1,11);
5分割のと正则化强度をして,形分类モデルモデルををを交差交差交差交差検证検证ますますますますますますますますををををををてて1e-8
に下げます。
rng(10);% For reproducibilityCVMdl = fitclinear(X,Ystats,'ObservationsIn',,,,'列',,,,'KFold',,,,5,。。。'学习者',,,,“逻辑”,,,,“求解器”,,,,'sparsa',,,,“正则化”,,,,'套索',,,,。。。'lambda',lambda,'GradientTolerance',1E-8)
CVMdl = ClassificationPartitionedLinear CrossValidatedModel: 'Linear' ResponseName: 'Y' NumObservations: 31572 KFold: 5 Partition: [1x1 cvpartition] ClassNames: [0 1] ScoreTransform: 'none' Properties, Methods
CVMdl
は分类区
モデルです。F一世tclinear
は5 分割の交差検証を実装するので、各分割について学習させる 5 つの分类线
モデルがCVMdl
に格纳さます。
各分割正则强度のを推定します。
efolds = kfoldedge(cvmdl,'模式',,,,'个人')
efolds =5×110.9958 0.9958 0.9958 0.9958 0.9958 0.9924 0.9770 0.9178 0.8452 0.8127 0.8127 0.9991 0.9991 0.9991 0.9991 0.9991 0.9938 0.9780 0.9201 0.8262 0.8128 0.8128 0.9992 0.9992 0.9992 0.9992 0.9992 0.9942 0.9781 0.9135 0.8253 0.8128 0.8128 0.9974 0.9974 0.9974 0.9974 0.9974 0.9931 0.9773 0.9121 0.8410 0.8130 0.8130 0.9976 0.9976 0.9976 0.9976 0.9976 0.99420.9782 0.9157 0.8368 0.8127 0.8127
e折
5行11列列の行列です。はにに,はは兰姆达
の正则强度に対応。。e折
を使用して、性能が低い分割、つまり非常に低いエッジを特定します。
各正について,の分割に対するエッジ推定推定ますます。
e= kfoldedge(CVMdl)
e=1×110。9978 0.9978 0.9978 0.9978 0.9978 0.9936 0.9777 0.9158 0.8349 0.8128 0.8128
各正則化強度について 5 分割エッジの平均をプロットすることにより、モデルがどの程度一般化を行うかを判断します。グリッド全体で 5 分割エッジを最大化する正則化強度を特定します。
数字;图(log10(lambda),log10(e),'-o')[〜,maxeidx] = max(e);maxlambda = lambda(maxeidx);抓住上图(log10(maxlambda),log10(e(maxeidx)),'ro');ylabel('log_ {10} 5倍边')xlabel('log_ {10} lambda')legend('边缘',,,,'Max edge') 抓住离开
いくつかの兰姆达
lambdaのますますエッジエッジエッジエッジがのののがが大きくなるなるなるととと,予测子予测子変数がスパースにになります。。これはは
エッジが低下する直前にある正則化強度を選択します。
lambdafinal = lambda(5);
正则化强度兰巴非省
を指定データ全体を使用て线形モデル学习をささます。
mdlfinal=F一世tclinear(X,Ystats,'ObservationsIn',,,,'列',,,,。。。'学习者',,,,“逻辑”,,,,“求解器”,,,,'sparsa',,,,“正则化”,,,,'套索',,,,。。。'lambda',,,,lambdaFinal);
新しい観测のを推定するに,,mdlfinal
と新しいデータを预测
に渡します。
详细
分类エッジ
“分类”は,マージンの加重。。
特徴选択するなどに复数のの选択する方法のののつつつつつはエッジがが最大になるなる分类分类器器器
分類マージン
バイナリ分类の“分类”は、各観測値における真のクラスの分類スコアと偽のクラスの分類スコアの差です。
このソフトウェア,バイナリの分类マージン次ように定义されます。
xは。。。の真のラベル,,,,,,,,,,,,,,,,,,,,,,,,それそれ以外以外以外以外のはははははははは–f(x)はには,マージンはm = yf(x)と定义れてい。。
各マージンのスケールが同じである場合、マージンを分類の信頼尺度として使用できます。複数の分類器の中で、マージンが大きい分類器の方が優れています。
分類スコア
線形分類モデルの場合、行ベクトルである観測値 x を陽性クラスに分類する生の“分类”は次定义され。。
正则化ががのモデルで,,
は推定された係数の列ベクトル (モデルのbeta(:,j)
プロパティ),
は推定されたスカラー バイアス (モデルの偏见(J)
プロパティ)ですです
xを阴性分类する生-f(x)ですですですこのソフトウェアでは,,がにになるなるクラスにに観测観测値
線形分類モデルがロジスティック回帰学習器から構成されている場合、このソフトウェアでは“ logit”
スコア変换生分类スコアに适用され(ScoreTransform
を参照)。
バージョン履歴
matlabコマンド
次の MATLAB コマンドに対応するリンクがクリックされました。
コマンドを MATLAB コマンド ウィンドウに入力して実行してください。Web ブラウザーは MATLAB コマンドをサポートしていません。
选择一个网站
Choose a web site to get translated content where available and see local events and offers. Based on your location, we recommend that you select:。
您还可以从以下列表中选择一个网站:
How to Get Best Site Performance
选择中国网站(中文或英语)以获得最佳场地性能。其他Mathworks乡村网站未针对您所在的访问进行优化。
美洲
- América Latina(Español)
- 加拿大((英语)
- 美国((英语)
欧洲
- Netherlands((英语)
- 挪威((英语)
- Österreich(德意志)
- 葡萄牙((英语)
- 瑞典((英语)
- 瑞士
- United Kingdom((英语)