统计和机器学习工具箱

使用统计学和机器学习分析和建模数据

下载免费试用

查看定价

统计和机器学习工具箱™提供描述，分析和模型数据的功能和应用。您可以使用描述性统计，可视化和聚类来进行探索数据分析;适合数据的概率分布;为Monte Carlo模拟生成随机数，并执行假设测试。回归和分类算法允许您使用AutomL使用分类和回归学习者应用程序的数据和建立预测模型的推论，并使用Automal使用Automl。

对于多维数据分析和特征提取，工具箱提供了主成分分析（PCA）、正则化、降维和特征选择方法，使您能够识别具有最佳预测能力的变量。

工具箱提供监督，半监督和无监督机器学习算法，包括支持向量机（SVM）、增强决策树、万博1manbetxk-均值和其他聚类方法。您可以应用可解释性技术，如部分依赖图和LIME，并自动生成用于嵌入式部署的C/C++代码。许多工具箱算法可用于太大而无法存储在内存中的数据集。

开始：

什么是统计和机器学习工具箱？

探索性数据分析

通过与交互式图形和描述性统计数据统计绘图探索数据。使用群集标识模式和功能。

可视化效果

使用概率图、方框图、直方图、分位数-分位数图和多变量分析的高级图（如树状图、双图和Andrews图）直观地探索数据。

多元数据可视化

现有统计图概述

分组数据的箱线图

使用随机邻居嵌入可视化高维数据

使用多维散点图探索变量之间的关系。

描述性统计

使用一些高度相关的数字快速了解并描述潜在的大量数据。

描述性统计概述

按类别分组的摘要统计数据

处理缺失值的数据

使用内核平滑功能的密度估计

使用分组平均数和方差探索数据。

聚类分析

通过使用k-means、k-medoids、DBSCAN、层次和光谱聚类以及高斯混合和隐马尔可夫模型对数据进行分组来发现模式。

聚类分析

基于密度的噪声应用的空间聚类（DBSCAN）

使用K-Means发现基因表达谱

使用高斯混合模型的集群

基于拉普拉斯分数的无监督学习排序特征

将DBSCAN应用于两个同心组。

特征提取和减少维度

将原始数据转换为最适合机器学习的功能。迭代探索并创建新功能，然后选择优化性能的功能。

特征提取

使用稀疏滤波和ICA重建等无监督学习技术从数据中提取特征。您还可以使用专门的技术从图像、信号、文本和数字数据中提取特征。

特征提取工作流

信号和图像的特征提取

文本数据准备与文本分析工具箱

基于深度学习特征的图像分类

从移动设备提供的信号中提取特征。

功能选择

自动识别提供最佳预测电源的功能子集，可以在建模数据中。特征选择方法包括逐步回归，顺序特征选择，正则化和集合方法。

使用邻域分量分析（NCA）进行分类检测特征

使用最小冗余最大相关性（MRMR）对分类的特征进行排序

选择用于分类高维数据的功能

通过应用正则化防止过拟合

NCA有助于选择保留模型的最精确度的功能。

特征转换和减少维度

通过将现有（非分类）特征转换为新的预测变量来减少维度，其中可以丢弃更少的描述性功能。特征转换方法包括PCA，因子分析和非负矩阵分解。

MATLAB中的降维与特征变换技术综述

使用主成分分析法分析美国城市的生活质量

了解功能转换和选择技术

PCA可以将高维向量投影到具有保存的大多数信息的低维正交坐标系上。

机器学习

使用交互式应用程序或自动机器学习（AutoML）建立预测分类和回归模型。自动选择要素、确定最佳模型并调整超参数。

培训、验证和调整预测模型

比较各种机器学习算法–包括浅层神经网络，选择功能，调整HyperParameters，并评估许多流行分类和回归算法的性能。构建并自动使用交互式应用程序优化预测模型，并逐步改进具有流数据的模型。通过应用半监督学习来减少标记数据的需求。

在回归学习者应用程序中训练回归模型

回归学习者应用程序(3:42)

MATLAB用于数据分析（3:55）

建设和评估预测模型的最佳实践

使用ROC曲线评估分类模型(4:43)

二元分类的增量线性学习

基于半监督学习的标签数据

使用分类学习者应用分类数据

模型解释性

通过使用生成添加剂模型（GAM）等固有的可解释模型来增强黑箱机器学习模型的可解释性，或者通过应用包括部分依赖性地块，个人有条件期望（ICE），局部可解释模型 - 不可知解释（石灰）和福利价值观。

MATLAB可解释性概述

应用部分依赖性地块（PDP）和个人有条件期望（ICE）绘图到回归

MATLAB中的模型解释性(5:49)

本地可解释模型 - 不可知的解释（石灰）

在MATLAB中应用Shapley值

用于不同分类器的决策曲面

石灰在局域建立复杂模型的简单近似。

自动化机器学习（Automl）

通过自动调整超参数，生成和选择功能和模型来提高模型性能，以及通过成本矩阵寻址数据集不平衡。

什么是AutoML？

一步式自动模型选择和超参数优化

覆盖物优化解释了(4:43)

贝叶斯优化工作流

基于NCA的稳健回归特征选择

使用贝叶斯优化有效地优化超参数。

回归和Anova.

模型作为一个或多个预测器的函数，使用线性和非线性回归，混合效果模型，广义线性模型和非参数回归来模拟连续响应变量。使用ANOVA分配给不同源的差异。

线性和非线性回归

从许多线性和非线性回归算法中选择具有多个预测器或响应变量的复杂系统的模型行为。使用嵌套和/或交叉随机效应拟合多级或分层、线性、非线性和广义线性混合效应模型，以执行纵向或面板分析、重复测量和增长建模。

将回归分析应用于NYC住房数据

使用回归学习器应用程序预测电力负荷(3:42)

描述非线性关系

基于MATLAB的多级混合效应建模(34:44)

了解广义线性模型

使用回归学习器应用程序以交互方式拟合回归模型。

非参数回归

使用支持向量机、随机森林、浅层神经网络、高斯过程和高斯核生成精确拟合，而无需指定描述预测值和响应之间关系的模型。

拟合和优化支持向量机（SVM）回归模型万博1manbetx

用回归随机森林预测保险风险

了解高斯进程回归

使用量级回归检测异常值

识别使用大分回归的异常值。

方差分析（ANOVA）

将样本方差分配给不同的源，并确定各种群体中是否出现在不同人群中。使用单向，双向，多路，多变量和非参数ANOVA，以及协方差分析（ANOCOVA）和反复措施的方差分析（RANOVA）。

单向ANOVA简介

了解多种比较

平衡和非平衡数据的多因素方差分析（N因素方差分析）

试验组采用多因素方差分析。

概率分布和假设试验

拟合到数据的分布。分析样品到样本差异是否具有显着或与随机数据变化一致。生成各种分布的随机数。

概率分布

拟合连续和离散分布，使用统计图评估拟合优度，并计算超过40种不同的分布。

使用Distribution Fitter应用程序建模数据

可用概率分布

拟合自定义单变量分布

使用Distribution Fitter应用程序以交互方式安装分发。

随机数生成

从装配或构造的概率分布产生伪随机和准随机数流。

交互式生成随机数

生成准随机数

了解蒙特卡罗模拟

使用Copulas模拟依赖变量

交互式生成随机数。

假设检验

执行T检验，分配测试（Chi-Square，Jarque-Bera，Lipleiefors和Kolmogorov-Smirnov），以及一个，配对或独立样品的非参数测试。测试自动鼠标和随机性，以及比较分布（两个样本Kolmogorov-Smirnov）。

假设检验导论

单面或双面t检验：测试比例或相关性

进行两个样本T检验

卡方拟合优度检验

在单面T检验中的抑制区域。

工业统计

统计分析影响和数据趋势。应用工业统计技术，如定制实验设计和统计过程控制。

实验设计（DOE）

定义、分析和可视化定制DOE。创建并测试如何操作数据输入的实际计划，以生成有关其对数据输出的影响的信息。

系统数据收集规划实验简介

响应表面设计，包括Box-Behnken

应用Box-Behnken设计生成高阶响应面。

统计过程控制（SPC）

通过评估过程可变性来监测和改进产品或过程s manbetx 845。创建控制图，估算过程能力，并执行量具重复性和再现性研究。

控制图表简介

使用六西格玛技术设计改进发动机冷却风扇

使用控制图监控制造过程。

可靠性和生存分析

通过执行COX比例危险回归和拟合分布，可视化和分析故障时间数据。计算经验危险，幸存者和累积分布函数，以及内核密度估计。

具有时间相关协变量的Cox比例风险模型

使用Kaplan-Meier估算累积危害，幸存者和累积分布

使用Cox比例危险模型估算重新招生

用审查分析终身数据

故障数据作为“受审查”值的示例。

大数据，并行化和云计算

将统计和机器学习技术应用于内存up-Mement数据。加快统计计算和机器学习模型培训，并在集群和云实例上与并行化。

使用高阵列分析大数据

在不更改代码的情况下，使用具有许多分类、回归和聚类算法的高数组和表来训练不适合内存的数据集上的模型。

使用高阵列的大数据集模型飞行延迟

支持高阵列的功能概述万博1manbetx

卡特彼勒的大数据、数据分析和机器/深度学习基础设施(18:47)

Matlab高大阵列在行动中

并行计算

并行化加快统计计算和模型训练。

用并行计算工具箱实现机器学习的并行化™

了解如何在MATLAB中加快计算

MATLAB与R基准

MATLAB与Python：选择MATLAB的主要原因

使用并行计算工具箱或MATLAB并行服务器加速计算™.

云与分布式计算

使用云实例加快统计和机器学习计算。在MATLAB Online™中执行完整的机器学习工作流程。

使用MATLAB参考体系结构访问AWS和Azure上的云实例

在Web浏览器中访问MATLAB

访问nvidia gpu云上的云实例

在Amazon或Azure云实例上执行计算。

部署，代码生成和Simulink集成万博1manbetx

部署统计信息和机器学习到嵌入式系统，使用C代码加速计算密集型计算，并与企业系统和Simulink模型集成。万博1manbetx

代码生成

使用MATLAB编码器生成可分类和可读的C和C++代码，用于分类和回归算法、描述统计和概率分布的推理™. 使用定点设计器生成精度较低的C/C++预测代码™, 以及在不重新生成预测代码的情况下更新部署模型的参数。

代码生成工作流程概述

使用Coder应用程序为机器学习模型生成C代码

更新代码生成的模型参数

为SVM预测生成固定点C / C ++

用于分类和代码生成的系统对象

部署的两种途径：生成C代码或编译MATLAB代码。

与Simulink的集成万博1manbetx

将机器学习模型与Simulink模型集成，以部署到嵌入式硬件或系统仿真，验证和万博1manbetx验证。

使用本地块在Simulink中集成SVM预测万博1manbetx

在Simulink中应用机器学习万博1manbetx使用MATLAB功能块

Simulink library for machine learning with native blocks for SVM prediction.

" data-toggle="lightbox" class="fluid_link">

万博1manbetx用于机器学习的Simulink库，用于SVM预测的本机块。

与应用程序和企业系统集成

将统计和机器学习模型部署为独立、MapReduce或Spark™ 应用；作为网络应用程序；还是微软^®擅长^®使用Matlab Compiler™的加载项。构建C / C ++共享库，Microsoft .NET程序集，Java^®课程和python^®使用MATLAB编译器SDK的软件包™.

在Web应用程序中部署电力负载预测模型

在智能手机上部署人类活动识别

在Domino数据实验室上运行MATLAB，加速模型培训

使用MATLAB编译器集成空气质量分类模型。

产品资源：

文档功能技术文章用户故事产品要求发行说明视频和网络研讨会例子

统计和机器学习工具箱

统计和机器学习工具箱

使用统计学和机器学习分析和建模数据

开始：

探索性数据分析

可视化效果

描述性统计

聚类分析

特征提取和减少维度

特征提取

功能选择

特征转换和减少维度

机器学习

培训、验证和调整预测模型

模型解释性

自动化机器学习（Automl）

回归和Anova.

线性和非线性回归

非参数回归

方差分析（ANOVA）

概率分布和假设试验

概率分布

随机数生成

假设检验

工业统计

实验设计（DOE）

统计过程控制（SPC）

可靠性和生存分析

大数据，并行化和云计算

使用高阵列分析大数据

并行计算

云与分布式计算

部署，代码生成和Simulink集成万博1manbetx

代码生成

与Simulink的集成万博1manbetx

与应用程序和企业系统集成

产品资源：

免费试用

准备好买了吗？

你是一个学生吗？