统计和机器学习工具箱
分析和使用统计和机器学习模型数据
统计和机器学习工具箱™提供的功能和应用程序来描述,分析和模型数据。您可以使用描述性统计和图表的探索性数据分析,拟合概率分布数据,生成Monte Carlo模拟随机数,并进行假设检验。回归和分类算法让你从数据中得出的推论,并建立预测模型。
对于多维数据分析,统计和机器学习工具箱提供的功能选择,逐步回归,主成分分析(PCA),正规化,和其他降维方法,让您识别变量或功能会影响你的模型。
工具箱提供监督和无监督机器学习算法,包括支持向量机(SVM),升压和袋装决策树,k-最近邻,k均值,K-中心点划分,层次聚类,高斯混合模型,和隐马尔可夫模型。万博1manbetx许多统计和机器学习算法,可用于对数据集是太大而无法存储在内存中的计算。
入门:
可视化
视觉上探索使用概率图,箱形图,直方图,分位数 - 分位数图,以及先进的地块为多变量分析,例如树状图,二维图,并且图安德鲁斯数据。
聚类分析
发现图案通过使用k均值,K-中心点划分,DBSCAN,层次聚类,以及高斯混合和隐马尔可夫模型的分组数据。
特征提取
提取物使用无监督学习技术,如疏滤波和重建ICA数据特征。您还可以使用专门的技术来提取图像,信号文本及数字数据的功能。
特征选择
自动识别,在数据建模提供最好的预测能力要素的子集。特征选择方法包括逐步回归,连续特征选择,正则化,和集成方法。
特征变换和降维
通过将现有的(非绝对)减少维度功能到新的预测变量,其中描述性较差的特点可以被丢弃。功能转化方法包括PCA,因素分析,以及非负矩阵分解。
火车,验证和调整预测模型
比较不同的机器学习算法,选择功能,调整超参数,以及评估预测的性能。建立和自动优化预测模型互动的应用程序。
分类
模型中的分类响应变量作为一个或多个预测的函数。使用各种参数和非参数分类算法,包括逻辑回归,SVM,提振和袋装决策树,朴素贝叶斯,判别分析和k近邻。
自动化模型优化
提高由自动调谐超参数,选择功能,和寻址数据集的不平衡与成本矩阵模型的性能。
线性和非线性回归
与多个预测或响应变量从许多线性和非线性回归算法选择复杂的系统模型的行为。配合多层或分层的,线性,非线性,以及广义线性混合效应模型具有嵌套和/或交叉的随机效果来执行纵向或面板的分析,重复测量和生长建模。
非参数回归
产生一个精确的配合,而无需指定,描述预测和应对,包括支持向量机,随机森林,高斯过程,和高斯内核之间的关系的模型。
方差分析(ANOVA)
分配样本方差到不同的源,并确定变化是否内或不同的人群中发生。使用单向,双向,多向,多元,和非参数ANOVA,以及协方差分析(ANOCOVA)和方差(朗诺)的重复测量分析。
概率分布
配合连续和离散分布,使用统计图评估拟合优度配合,并且计算概率密度函数和累积分布函数为超过40点不同的分布。
假设检验
执行t检验,分布测试(卡方,哈尔克-贝拉,里尔福斯,和Kolmogorov-斯米尔诺夫),和非参数检验为一体,配对,或独立的样品。试验自动更正和随机性,并比较分布(双样本的Kolmogorov-斯米尔诺夫)。
试验设计(DOE)
定义,分析和可视化的实验,以定制的设计(DOE)。创建和测试实际计划如何串联处理数据输入生成有关他们的数据输出影响的信息。
可靠性和生存分析
可视化和分析时间到故障数据具有和不具有通过执行Cox比例风险回归和拟合分布审查。计算经验风险,幸存者,累积分布函数和内核密度估计。
与高大的阵列分析大数据
用高大的阵列和表格有许多分类,回归和聚类算法对数据集不装入内存,无需更改代码的训练模式。
云和分布式计算
使用云实例,加快统计和机器学习计算。请在MATLAB在线整机学习工作流程™。
代码生成
生成用MATLAB编码器的便携式和可读C或C ++的用于分类和回归算法,描述性统计推理码,并且概率分布TM值。加快通过MATLAB功能块和系统块使用机器学习模型的高保真仿真的验证和确认。
与应用程序和企业系统集成
部署统计和机器学习模型作为独立的,MapReduce的,星火™应用程序,Web应用程序,和微软®高强®插件使用MATLAB编译器™。构建C / C ++共享库,微软.NET程序集,爪哇®类和Python®使用MATLAB编译SDK™软件包。