多元线性回归- MATLAB和Simulink万博1manbetx - 万博1manbetx,s manbetx 845,万博尤文图斯

多元线性回归

多元方法简介

大型、高维数据集在基于计算机的仪器仪表和电子数据存储的现代时代很常见。高维数据对统计可视化、分析和建模提出了许多挑战。

当然，数据可视化不可能超出几个维度。因此，模式识别、数据预处理和模型选择必须在很大程度上依赖数值方法。

高维数据分析的一个基本挑战是所谓的维度诅咒．高维空间中的观测必然比低维空间中的观测更稀疏、更不具有代表性。在高维中，数据过度表示抽样分布的边缘，因为高维空间的区域在表面附近包含了它们的大部分体积。(一个d一维球壳的体积，相对于球的总体积，趋近于1d趋向于无穷。)在高维中，分布内部的典型数据点采样频率较低。

通常，数据集中的许多维度——测量的特征——在生成模型时是没有用的。特性可能是不相关的或冗余的。回归和分类算法可能需要大量的存储和计算时间来处理原始数据，即使算法成功，得到的模型可能包含难以理解的术语数量。

由于这些挑战，多变量统计方法通常以某种类型的数据开始降维，其中数据由低维空间中的点近似表示。降维是本章所介绍的方法的目标。降维通常会导致更简单的模型和更少的测量变量，当测量成本昂贵且可视化很重要时，就会带来好处。

多元线性回归模型

多元线性回归模型表示d-维连续响应向量作为预测项的线性组合加上具有多元正态分布的误差项向量。让 $y_{我} ＝ {（ y_{我 1} ， .．. ， y_{我 d} ）}^{”}$ 表示观察的响应向量我，我= 1,…,n．在最一般的情况下，给定d——- - - - - -K设计矩阵 $X_{我}$ 和K-by-1的系数向量 $β$ ，多元线性回归模型为