统计和机器学习工具箱

分析和使用统计和机器学习模型数据

统计和机器学习工具箱™提供的功能和应用程序来描述,分析和模型数据。您可以使用描述性统计和图表的探索性数据分析,拟合概率分布数据,生成Monte Carlo模拟随机数,并进行假设检验。回归和分类算法让你从数据中得出的推论,并建立预测模型。

对于多维数据分析,统计和机器学习工具箱提供的功能选择,逐步回归,主成分分析(PCA),正规化,和其他降维方法,让您识别变量或功能会影响你的模型。

工具箱提供监督和无监督机器学习算法,包括支持向量机(SVM),升压和袋装决策树,k-最近邻,k均值,K-中心点划分,层次聚类,高斯混合模型,和隐马尔可夫模型。万博1manbetx许多统计和机器学习算法,可用于对数据集是太大而无法存储在内存中的计算。

入门:

探索性数据分析

通过与交互式图形和描述性统计统计绘图浏览数据。识别模式和功能与聚类。

可视化

视觉上探索使用概率图,箱形图,直方图,分位数 - 分位数图,以及先进的地块为多变量分析,例如树状图,二维图,并且图安德鲁斯数据。

使用多维散点图探索变量之间的关系。

描述性统计

理解和描述潜在的大型数据集的快速使用一些高度相关的数字。

探索利用分组均值和方差的数据。

聚类分析

发现图案通过使用k均值,K-中心点划分,DBSCAN,层次聚类,以及高斯混合和隐马尔可夫模型的分组数据。

应用DBSCAN两个同心组。

特征提取和降维

将原始数据转换成最适合的机器学习功能。反复地探索和创造新的功能,并选择那些优化性能。

特征提取

提取物使用无监督学习技术,如疏滤波和重建ICA数据特征。您还可以使用专门的技术来提取图像,信号文本及数字数据的功能。

提取由移动设备提供的信号的功能。

特征选择

自动识别,在数据建模提供最好的预测能力要素的子集。特征选择方法包括逐步回归,连续特征选择,正则化,和集成方法。

NCA帮助选择保留大部分模型的精确度的特点。

特征变换和降维

通过将现有的(非绝对)减少维度功能到新的预测变量,其中描述性较差的特点可以被丢弃。功能转化方法包括PCA,因素分析,以及非负矩阵分解。

PCA项目很多变量在一些正交那些保留大部分的信息。

机器学习

构建使用交互式应用程序的预测分类和回归模型。通过优化的超参数自动选择功能和调整模型。

火车,验证和调整预测模型

比较不同的机器学习算法,选择功能,调整超参数,以及评估预测的性能。建立和自动优化预测模型互动的应用程序。

分类

模型中的分类响应变量作为一个或多个预测的函数。使用各种参数和非参数分类算法,包括逻辑回归,SVM,提振和袋装决策树,朴素贝叶斯,判别分析和k近邻。

与分类学习应用程序交互训练分类。

自动化模型优化

提高由自动调谐超参数,选择功能,和寻址数据集的不平衡与成本矩阵模型的性能。

优化的超参数有效地利用贝叶斯优化。

回归和ANOVA

模型中的连续响应变量作为一个或多个预测的函数,使用线性和非线性回归,混合效应模型,广义线性模型,和非参数回归。分配差异用方差分析不同的来源。

线性和非线性回归

与多个预测或响应变量从许多线性和非线性回归算法选择复杂的系统模型的行为。配合多层或分层的,线性,非线性,以及广义线性混合效应模型具有嵌套和/或交叉的随机效果来执行纵向或面板的分析,重复测量和生长建模。

飞度回归模型交互与回归学习应用。

非参数回归

产生一个精确的配合,而无需指定,描述预测和应对,包括支持向量机,随机森林,高斯过程,和高斯内核之间的关系的模型。

确定采用分位数回归的异常值。

方差分析(ANOVA)

分配样本方差到不同的源,并确定变化是否内或不同的人群中发生。使用单向,双向,多向,多元,和非参数ANOVA,以及协方差分析(ANOCOVA)和方差(朗诺)的重复测量分析。

使用多路ANOVA测试组。

概率分布和假设检验

飞度分布数据。分析样品到样品的差异是否显著或用随机数据的变化相一致。生成各种分布的随机数。

概率分布

配合连续和离散分布,使用统计图评估拟合优度配合,并且计算概率密度函数和累积分布函数为超过40点不同的分布

飞度分布交互方式使用分配钳工应用。

随机数生成

生成伪随机和从任一装配或构造的概率分布的准随机数流。

交互生成随机数。

假设检验

执行t检验,分布测试(卡方,哈尔克-贝拉,里尔福斯,和Kolmogorov-斯米尔诺夫),和非参数检验为一体,配对,或独立的样品。试验自动更正和随机性,并比较分布(双样本的Kolmogorov-斯米尔诺夫)。

在单侧t检验拒绝区域。

工业统计

统计分析效果和数据趋势。工业应用统计技术,如实验定制设计和统计过程控制。

试验设计(DOE)

定义,分析和可视化的实验,以定制的设计(DOE)。创建和测试实际计划如何串联处理数据输入生成有关他们的数据输出影响的信息。

套用箱Behnken法设计产生更高阶响应面。

统计过程控制(SPC)

监控并通过评估过程变化改进产品或工艺。s manbetx 845创建控制图,估计过程能力,并进行计重复性和再现性研究。

监测使用控制图的制造过程。

可靠性和生存分析

可视化和分析时间到故障数据具有和不具有通过执行Cox比例风险回归和拟合分布审查。计算经验风险,幸存者,累积分布函数和内核密度估计。

故障数据为“截尾”值的示例。

规模大数据和云计算

应用统计和机器学习技术来进行内存的数据。加快统计计算和集群和云实例机器学习模型训练。

与高大的阵列分析大数据

用高大的阵列和表格有许多分类,回归和聚类算法对数据集不装入内存,无需更改代码的训练模式。

加快并行计算工具箱或MATLAB并行服务器™计算。

云和分布式计算

使用云实例,加快统计和机器学习计算。请在MATLAB在线整机学习工作流程™。

执行对亚马逊或Azure云计算实例。

部署和代码生成

部署统计和机器学习嵌入式系统,加快用C代码计算密集型的计算,并与企业系统集成。

代码生成

生成用MATLAB编码器的便携式和可读C或C ++的用于分类和回归算法,描述性统计推理码,并且概率分布TM值。加快通过MATLAB功能块和系统块使用机器学习模型的高保真仿真的验证和确认。

两条路径展开:生成C代码或编译的MATLAB代码。

与应用程序和企业系统集成

部署统计和机器学习模型作为独立的,MapReduce的,星火™应用程序,Web应用程序,和微软®高强®插件使用MATLAB编译器™。构建C / C ++共享库,微软.NET程序集,爪哇®类和Python®使用MATLAB编译SDK™软件包。

使用MATLAB编译器集成了空气质量的分类模型。

更新部署模型

部署模型的更新参数,而无需重新生成C / C ++代码预测。

代码生成和模型更新工作流程。

最新功能

自动化机器学习(AutoML)

自动选择分类的最佳模式和相关的超参数(fitcauto

特征选择

排名功能使用卡方检验(fscchi2)用于分类和F-测试(fsrftest)的回归问题

代码生成

预测采用全数字表(需要MATLAB编码器)

代码生成

生成决策树和决策树的合奏(需要MATLAB编码器和定点设计师)定点C / C ++代码

GPU支万博1manbetx持

加速科尔随机,并通过在GPU 32个执行的概率分布函数(需要并行计算工具箱)

查看发行说明对任何这些特征和对应的功能的详细说明。

机器学习匝道

的交互式介绍实用的机器学习方法的分类问题。