使用并行处理的回归树bagger工作流

这个示例使用:

这个例子展示了如何:

使用套袋回归树来评估特征的重要性。
通过并行计算提高计算速度。

样本数据是一个1985年汽车进口的数据库，包含205个观察数据、25个预测数据和1个响应，即保险风险评级或“符号”。前15个变量是数字的，后10个是分类的。符号索引取从-3到3的整数值。

加载样例数据并将其划分为预测器和响应数组。

负载进口- 85;Y = X (: 1);X = X(:, 2:结束);

设置并行环境以使用默认的工作器数量。创建这个例子的计算机有6个核心。

mypool = parpool

使用'local'配置文件启动并行池(parpool)…Connected to the parallel pool (number of workers: 6). mpool = ProcessPool with properties: Connected: true NumWorkers: 6 Cluster: local attachhedfiles: {} AutoAddClientPath: true IdleTimeout: 30 minutes (30 minutes remaining) SpmdEnabled: true

将选项设置为使用并行处理。

paroptions = statset (“UseParallel”,真正的);

利用叶子大小估计特征的重要性1和5000树并行。为函数计时，以便进行比较。

tic b = TreeBagger(5000,X,Y)“方法”，“r”，“OOBVarImp”，“上”，．..“猫”16:25,“MinLeafSize”, 1“选项”, paroptions);toc

运行时间是9.873065秒。

串行执行相同的计算以进行时间比较。

tic b = TreeBagger(5000,X,Y)“方法”，“r”，“OOBVarImp”，“上”，．..“猫”16:25,“MinLeafSize”1);toc

经过时间是28.092654秒。

结果表明，并行计算只需要串行计算的一小部分时间。注意，经过的时间可能会根据您的操作系统而变化。

另请参阅

statset|TreeBagger|parpool(并行计算工具箱)

统计和机器学习工具箱文档

万博1manbetx

掌握机器学习:MATLAB一步一步的指南

下载电子书

使用并行处理的回归树bagger工作流

另请参阅

相关的话题

统计和机器学习工具箱文档

万博1manbetx

掌握机器学习:MATLAB一步一步的指南