什么是线性回归?

描述数学关系并从实验数据中进行预测

线性回归是一种统计建模技术,用于描述作为一个或多个预测变量的函数的连续响应变量。它可以帮助您理解和预测复杂系统的行为或分析实验,财务和生物数据。

线性回归技术用于创建线性模型。该模型描述了从属变量\(y \)(也称为响应)之间的关系作为一个或多个独立变量\(x_i \)的函数(称为预测器)。线性回归模型的一般方程是:

\ [y = \ beta_0 + \ sum \ \ beta_i x_i + \ epsilon_i \]

其中\(贝塔\)表示要计算的线性参数估计,\(\epsilon\)表示误差项。

线性回归的类型

简单线性回归:只使用一个预测器的模型。一般方程为:

\ [y = \ beta_0 + \ beta_i x + \ epsilon_i \]

简单的线性回归例子展示了如何预测一个状态(响应变量,\(Y\))与状态(预测变量,\(X\))的人口(预测变量,\(X\))的致命交通事故数量。(看马铃薯®代码示例以及如何使用MLDIVIDE运算符来估算简单的线性回归的系数。)

多元线性回归:使用多个预测器的模型。此回归具有多个\(x_i \)来预测响应,\(y \)。这个等式的一个例子是:

\ [y = \ beta_0 + \ beta_1 x_1 + \ beta_2 x_2 + \ epsilon \]

多元线性回归的例子,预测不同的汽车每加仑(MPG)(响应变量,\(Y\))基于重量和马力(预测变量,X_j\))。(看Matlab代码示例,如何使用回归函数并确定多元线性回归关系的重要性。)

多变量线性回归:多个响应变量的模型。此回归具有从相同数据\(x \)的多个\(y_i \)。它们以不同的公式表达。具有2方程的该系统的示例是:

\ [Y_1 = \ beta_ {01} + \ beta_ {11} X_1 + \ epsilon_1 \]

\ [Y_2 = \ beta_ {02} + \ beta_ {1 2} X_1 + \ epsilon_2 \]

多元线性回归示例显示如何根据一年中的星期(预测变量,\(Y_i\))预测9个地区的流感估计(响应变量,\(Y_i\))。(看Matlab代码示例以及如何使用MVRegress函数来确定多变量线性回归的估计系数。)

多变量多线性回归:使用多个预测器进行多个响应变量的模型。此回归具有多个\(x_i \)来预测多个响应\(y_i \)。方程的概括是:

多变量多个线性回归示例,计算城市和高速公路MPG(作为响应变量,\(y_1 \)和\(y_2 \))从三个变量:轮基,遏制权重和燃料类型(预测变量,\(x_1 \),\(x_2 \)和\(x_3 \))。(看MATLAB代码示例以及如何使用mvregression函数来估计系数。

线性回归的应用

线性回归有一些特性,使它们在以下应用中非常有趣:

  • 预测或预测 - 使用回归模型来构建特定数据集的预测模型。从模型中,您可以使用回归来预测仅在响应值中已知的响应值。
  • 回归的强度 - 使用回归模型来确定变量与预测的关系是否存在关系,以及这种关系的强烈。

MATLAB线性回归

工程师通常创建简单的线性回归模型马铃薯。对于多变量和多变量的线性回归,可以使用统计和机器学习工具箱™从MATLAB。它支持逐步、稳健和多元回归:

  • 生成预测
  • 比较线性模型适合
  • 绘制残差
  • 评价拟合优度
  • 检测异常值

要创建一个将曲线和曲面与数据相匹配的线性模型,请参见曲线配件工具箱™