基于MATLAB的机器学习

使用袋装分类树的手写识别

这个例子展示了如何使用袋装分类树集合来识别手写数字。手写数字图像首先用于训练单个分类树,然后用于训练200个决策树的集合。使用混淆矩阵对每种分类性能进行比较。

负载训练和测试数据

有关获取数据集的信息,请参阅参考资料部分。
明确负载(“usps_all”);Reduce_dim = false;X = double(重塑(数据,256,11000)');Ylabel = [1:9 0];Y =重塑(repmat(ylabel,1100,1),11000,1);clearvars数据

可视化六个随机手写的样本

图(1)Ii = 1:6 subplot(2,3, Ii) rand_num = randperm(11000,1);图像(重塑(X (rand_num:), 16日16))标题((y (rand_num)),“字形大小”, 20)轴结束colormap灰色的

将数据随机划分为训练集和验证集

CV = cvpartition(y,“坚持”5);Xtrain = X(cv.training,:);Ytrain = y(cv.training,1);Xtest = X(cv.test,:);Ytest = y(cv.test,1);

使用单一分类树进行训练和预测

mdl_ctree = ClassificationTree.fit(Xtrain,Ytrain);ypred = predict(mdl_ctree,Xtest);Confmat_ctree = confusimat (Ytest,ypred);

使用袋装决策树进行训练和预测

mdl = fitensemble(Xtrain,Ytrain,“包”, 200,“树”“类型”“分类”);ypred = predict(mdl,Xtest);Confmat_bag = confismat (Ytest,ypred);

比较混淆矩阵

图,热图(Confmat_ctree, 0:9, 0:9, 1,“Colormap”“红色”“ShowAllTicks”, 1“UseLogColorMap”,真的,“Colorbar”,真正的);标题(“混淆矩阵:单一分类树”热图(Confmat_bag, 0:9, 0:9, 1,“Colormap”“红色”“ShowAllTicks”, 1“UseLogColorMap”,真的,“Colorbar”,真正的);标题(“混淆矩阵:袋装分类树的集合”

袋装分类树在训练集上的表现要比单一分类树好得多,因为混淆矩阵更偏向对角线。

使用可定制的热图

参考和许可

MAT文件的图像定位在这里