如何在拟合集合模型上使用预测函数获得分数作为概率估计?

62次浏览(过去30天)

显示旧的注释

MathWorks支万博1manbetx援小组 2018年3月19日

0
链接

直接链接到这个问题

https://la.mathworks.com/matlabcentral/answers/395526-how-do-i-obtain-scores-as-probabilistic-estimates-using-the-predict-function-on-a-fitcensemble-model

评论道: kubilay muameleci2022年1月7日

答:接受 MathWorks支万博1manbetx援小组

在运行了本文中的第一个示例() -“火车分类集合”后，我试图获得一个观测在两个类别之一的概率/分数。然而，通过传递这个函数[label,score] = predict(Mdl1,pX);分数很奇怪;

7.0616 - -7.0616

3.9722 - -3.9722

．...

有可能把这个转换成概率吗?

登录回答这个问题。

接受的答案

MathWorks支万博1manbetx援小组 2018年3月19日

1
链接

直接链接到这个答案

https://la.mathworks.com/matlabcentral/answers/395526-how-do-i-obtain-scores-as-probabilistic-estimates-using-the-predict-function-on-a-fitcensemble-model#answer_315608

命令'[label, score] = predict(Mdl1,pX)'不返回分数作为概率估计的原因是模型中使用的'LogitBoost'算法不将分数作为概率估计。相反，分数代表对一个类别的分类的信心，越高，越有信心。

下面的文档链接解释了这一点:

                             < //www.tianjin-qmedu.com/help/stats/compactclassificationensemble.predict.html＃bvciha4 >
                            

如果你想获得分数的概率估计，你可以考虑以下两种选择之一:

1)你可以将“fitcensemble”中的“ScoreTransform”名-值对设置为“logit”。这个名称-值对将分数转换为概率估计。

//www.tianjin-qmedu.com/help/stats/fitcensemble.html#bvcj_s0-1_sep_shared-ScoreTransform

然后在模型上使用predict返回每个类的概率值。

例如:

                             MdlFinal = fitcensemble(X,Y，“NumLearningCycles”idxNumTrees,.．.
                            
                             “学习者”tFinal,“LearnRate”learnRate (idxLR),“ScoreTransform”，分对数的）
                            
                             >> [~，scores] = predict(MdlFinal,X)
                            
                             成绩=
                            
                             0.0360 - 0.9640
                            
                             0.8054 - 0.1946
                            
                             0.0278 - 0.9722
                            
                             .．.

2)设置“fitcensemble”的“Method”名称-值对为“Bag”。

正如文档链接中提到的在这里，“Bag”算法将分数作为概率值返回。

'Method'名称-值对的文档链接可以在这里找到:

//www.tianjin-qmedu.com/help/releases/R2017a/stats/fitcensemble.html?s_tid=doc_ta#input_argument_d0e290851

6个评论
显示隐藏旧的评论

Bithika Chatterjee 2019年10月22日

你好,

我也面临着同样的问题。

使用机器学习UI生成以下用于训练的代码

classificationEnsemble = fitcensemble(…

预测,……

反应,…

“Method”，“RUSBoost”，…

“NumLearningCycles”，30，…

“学习者”，模板，…

'LearnRate'， 0.1，…

“类名”,[0;1);

使用预测函数创建结果结构

predictoreextracactionfcn = @(t) t(:， predictorNames);

ensemblePredictFcn = @(x) predict(classificationEnsemble, x);

trainedClassifier。预测Fcn = @(x) ensemblePredictFcn(predictorExtractionFcn(x));

然后对名为test的新表使用命令

(标签、分数)= trainedClassifier.predictFcn(测试)

然而，分数是这样来的

0.1008 - 1.5843

1.6184 - 0.0666

1.6851 0

1.6778 - 0.0072

1.6851 0

0.1842 - 1.5008

1.2034 - 0.4816

1.4613 - 0.2238

1.4890 - 0.1961

谁能告诉我如何得到0-1的概率估计值?我尝试使用这个选项“ScoreTransform”，“logit”，但这也给了我相同的分数。

还有谁能告诉我如何绘制这种预测的ROC曲线。

我尝试使用这个命令为ROC，我给出了我的预测分数

[X,Y] = perfcurve(true_labels,score,1)

把错误

使用perfcurve>preparedata错误(第1270行)

必须将scores作为浮点值的向量传递。

第二个参数分数是取第一列的值还是第二列的值，还是两者都取?

好心的帮助

kubilay muameleci 2022年1月7日

我不能得到两个分数列，即使我有两个类标签为“1”和“0”。我通过预测函数得到的分数只有一列。为什么呢?你能帮忙吗?

                                   数据=可读数据(“clean_data.csv”）;
                                  
                                   Split_size = 0.15;
                                  
                                   N = size(data,1);
                                  
                                   split = false(N,1);
                                  
                                   split(1:round(split_size*N)) = true;
                                  
                                   排列= randperm(N);
                                  
                                   Split =分裂(排列);
                                  
                                   trainingSet = data(~split，:);
                                  
                                   testingSet = data(split，:);
                                  
                                   trainingPredictors = trainingSet{:，2:29};
                                  
                                   trainingOutcomes = trainingSet{:，31};
                                  
                                   testingPredictors = testingSet{:，2:29};
                                  
                                   testingOutcomes = testingSet{:，31};
                                  
                                   X = trainingPredictors;
                                  
                                   y = trainingOutcomes;
                                  
                                   SVMModel = fitcsvm(X,y，“KernelFunction”，“rbf”，“KernelScale”sigmaOpts,.．.
                                  
                                   “BoxConstraint”boxOpts,“类名”, {' 0 '，' 1 '})；
                                  
                                   [predictedLabels,scores] = predict(svm模型，testingPredictors);

登录评论。

类别

人工智能，数据科学和统计学统计和机器学习工具箱分类分类集合体

了解更多分类集合体在帮助中心和文件交换

s manbetx 845

统计和机器学习工具箱

释放

R2017a

社区寻宝

在MATLAB Central中找到宝藏，并发现社区如何帮助您!

开始狩猎!

翻译的

如何在拟合集合模型上使用预测函数获得分数作为概率估计?

接受的答案

6个评论
显示隐藏旧的评论

更多答案(1)

0评论
显示隐藏-1旧的注释

另请参阅

类别

标签

s manbetx 845

释放

社区寻宝

如何在拟合集合模型上使用预测函数获得分数作为概率估计?

接受的答案

6个评论 显示隐藏旧的评论

更多答案(1)

0评论 显示隐藏-1旧的注释

另请参阅

类别

标签

s manbetx 845

释放

社区寻宝

6个评论
显示隐藏旧的评论

0评论
显示隐藏-1旧的注释