统计和机器学习工具箱
使用统计和机器学习分析和建模数据
统计和机器学习工具箱™提供描述,分析和模型数据的功能和应用。您可以使用描述性统计和图表进行探索数据分析,适用于数据的概率分布,为蒙特卡罗模拟生成随机数,并执行假设测试。回归和分类算法让您从数据和构建预测模型中汲取推断。
对于多维数据分析,统计和机器学习工具箱提供了特征选择,逐步回归,主成分分析(PCA),正则化和其他降维方法,让您识别影响模型的变量或特征。
该工具箱提供了监督和无监督的机器学习算法,包括支持向量机(SVM),提升和袋装决策树,K-最近邻居,K均值,K-METOIDS,分层聚类,高斯混合模型和隐藏的马尔可夫模型。万博1manbetx许多统计和机器学习算法可用于计算太大的数据集上,该数据集太大而无法存储在存储器中。
开始:
可视化
使用概率绘图,盒子图,直方图,分位数 - 分位数和多变量分析的高级绘图探索数据,例如树木图,双针和安德鲁斯图。
聚类分析
通过使用k-means,k-medoids,dbscan,分层聚类和高斯混合和隐藏的马尔可夫模型进行分组数据来发现模式。
特征提取
使用无监督的学习技术从数据中提取特征,例如稀疏过滤和重建ICA。您还可以使用专门的技术来提取图像,信号,文本和数字数据的特征。
功能选择
自动识别提供最佳预测电源的功能子集,可以在建模数据中。特征选择方法包括逐步回归,顺序特征选择,正则化和集合方法。
特征转换和减少维度
通过将现有(非分类)特征转换为新的预测变量来减少维度,其中可以丢弃更少的描述性功能。特征转换方法包括PCA,因子分析和非负矩阵分解。
分类
模拟分类响应变量作为一个或多个预测器的函数。使用各种参数和非参数分类算法,包括Logistic回归,SVM,增强和袋装决策树,天真贝叶斯,判别分析和K-Etcembers。
自动模型优化
通过自动调整超参数,选择要素和通过成本矩阵寻址数据集不平衡来提高模型性能。
线性和非线性回归
从许多线性和非线性回归算法中选择多个预测器或响应变量的复杂系统的模型行为。拟合具有嵌套和/或交叉随机效应的多层或分层、线性、非线性和广义线性混合效应模型,以执行纵向或面板分析、重复测量和增长建模。
非参数回归
在不指定描述预测器和响应之间的关系的情况下生成准确的拟合,包括SVM,随机林,高斯过程和高斯内核。
方差分析(ANOVA)
将样本方差分配给不同的源,并确定各种群体中是否出现在不同人群中。使用单向,双向,多路,多变量和非参数ANOVA,以及协方差分析(ANOCOVA)和反复措施的方差分析(RANOVA)。
概率分布
适合连续和离散的分布,使用统计图评估拟合优度,计算概率密度函数和累积分布函数超过40种不同的分布。
假设检验
执行T检验,分配测试(Chi-Square,Jarque-Bera,Lipleiefors和Kolmogorov-Smirnov),以及一个,配对或独立样品的非参数测试。测试自动鼠标和随机性,以及比较分布(两个样本Kolmogorov-Smirnov)。
实验设计(DOE)
定义、分析和可视化定制的实验设计(DOE)。创建并测试如何同时操作数据输入以生成有关其对数据输出影响的信息的实际计划。
统计过程控制(SPC)
通过评估过程可变性来监测和改进产品或过程s manbetx 845。创建控制图,估算过程能力,并执行量具重复性和再现性研究。
可靠性和生存分析
通过执行COX比例危险回归和拟合分布,可视化和分析故障时间数据。计算经验危险,幸存者,累积分布函数和核密度估计。
分析高阵列的大数据
使用具有许多分类,回归和聚类算法的高阵列和表,以在不改变代码的情况下培训不适合内存的数据集的模型。
云和分布式计算
使用云实例加快统计和机器学习计算。在MATLAB Online™中执行完整的机器学习工作流程。
代码生成
使用MATLAB Coder生成可移植和可读的C或c++代码,用于分类和回归算法的推理,描述性统计和概率分布TM值。使用MATLAB功能块和系统块使用机器学习模型加速验证和验证您的高保真仿真。
与应用程序和企业系统集成
将统计和机器学习模型部署为Standalone,MapReduce,Spark™应用程序,Web应用程序和Microsoft®excel.®使用Matlab Compiler™的加载项。构建C / C ++共享库,Microsoft .NET程序集,Java®课程和python®使用Matlab Compiler SDK™的包。
自动机器学习
自动选择最佳型号和相关的超参数以进行分类(fitcauto.
)
功能选择
使用Chi-Square测试等级功能(fscchi2
)分类和F-Tests(FSRFTEST.
)对于回归问题
代码生成
预测使用全数字表(需要MATLAB编码器)
代码生成
为决策树生成定点C / C ++代码,决策树的集合(需要MATLAB编码器和定点设计师)
GPU支万博1manbetx持
加速相关系数
那随机的
和32通过在GPU上执行(需要并行计算工具箱)的概率分布函数
看到发行说明有关这些功能的详细信息和相应的功能。
机器学习ondramp.
用于分类问题的实用机器学习方法的交互式介绍。