主要内容

mvregress

多元线性回归

描述

例子

β= mvregress (X,Y)返回的估计系数多元正态回归d维反应Y在设计矩阵X

例子

β= mvregress (X,Y,名称,值)返回指定的估计系数使用额外的选项名称-值对一个或多个参数。例如,您可以指定估计算法,初步估算值,或最大迭代次数的回归。

例子

(β,σ)= mvregress (___)估计也返回d——- - - - - -dvariance-covariance矩阵Y,使用任何输入参数从以前的语法。

例子

(β,σ,E,CovB,logL)= mvregress (___)返回一个残差矩阵E回归系数的估计,variance-covariance矩阵CovB和对数似然目标函数的值后,最后一次迭代logL

例子

全部折叠

适合面板数据多元回归模型,假设不同的拦截和常见的斜坡。

加载示例数据。

负载(“流感”)

数据集的数组流感包含国家流感疾病预防控制中心估计,九个独立的地区估计基于Google®查询数据。

提取和预测数据的响应。

Y =双(流感(:2:end-1));[n、d] = (Y)大小;x = flu.WtdILI;

的反应Y九个地区流感估计。每周观测存在一段时间, n = 52。反应的尺寸对应的区域,所以 d = 9。的预测因素x每周的国家流感估计。

情节流感数据,按地区分组。

图;区域= flu.Properties.VarNames (2: end-1);情节(x, Y,“x”)传说(地区,“位置”,“西北”)

图包含一个坐标轴对象。坐标轴对象包含9线类型的对象。这些对象代表NE MidAtl ENCentral, WNCentral, SAtl, ESCentral, WSCentral, Mtn, Pac。

多元回归模型 y j = α j + β x j + ϵ j ,在那里 = 1 , , n j = 1 , , d ,between-region并发相关 C O V ( ϵ j , ϵ j ) = σ j j

K = 10回归系数估计:九拦截条款和常见的斜率。输入参数X应该是一个 n 元胞数组的 d ——- - - - - - K 设计矩阵。

X =细胞(n, 1);i = 1: n X{我}=[眼睛(d) repmat (X (i), d, 1)];结束(β,σ)= mvregress (X, Y);

β包含的估计 K 维系数向量 ( α 1 , α 2 , , α 9 , β )

σ包含的估计 d ——- - - - - - d variance-covariance矩阵 ( σ j ) d × d , , j = 1 , , d between-region并发的相关性。

画出拟合回归模型。

B =[β(1:d); repmat(β(结束),1 d)];xx = linspace (5, 3.5);适合=[(大小(xx)), xx] * B;图;h =情节(x, Y,“x”xx,适合“- - -”);i = 1: d组(h (d + i),“颜色”get (h(我),“颜色”));结束传奇(地区,“位置”,“西北”);

图包含一个坐标轴对象。坐标轴对象包含18行类型的对象。这些对象代表NE MidAtl ENCentral, WNCentral, SAtl, ESCentral, WSCentral, Mtn, Pac。

图显示每个回归线都有不同的拦截,但相同的斜率。目视检查,一些回归行似乎符合数据比其他人更好。

适合使用最小二乘面板数据多元回归模型,假设不同的拦截和斜坡。

加载示例数据。

负载(“流感”);

数据集的数组流感包含国家流感疾病预防控制中心估计,九个独立的地区估计基于Google®查询。

提取和预测数据的响应。

Y =双(流感(:2:end-1));[n、d] = (Y)大小;x = flu.WtdILI;

的反应Y九个地区流感估计。每周观测存在一段时间, n = 52。反应的尺寸对应的区域,所以 d = 9。的预测因素x每周的国家流感估计。

多元回归模型 y j = α j + β j x j + ϵ j ,在那里 = 1 , , n j = 1 , , d ,between-region并发相关 C O V ( ϵ j , ϵ j ) = σ j j

K = 18回归系数估计:九拦截,斜率和9项。X是一个 n 元胞数组的 d ——- - - - - - K 设计矩阵。

X =细胞(n, 1);i = 1: n X{我}=[眼睛(d) X(我)*眼(d)];结束(β,σ)= mvregress (X, Y,“算法”,“cwls”);

β包含的估计 K 维系数向量 ( α 1 , α 2 , , α 9 , β 1 , β 2 , , β 9 )

画出拟合回归模型。

B =[β(1:d);β(d + 1:结束)');xx = linspace (5, 3.5);适合=[(大小(xx)), xx] * B;图;h =情节(x, Y,“x”xx,适合“- - -”);i = 1: d组(h (d + i),“颜色”get (h(我),“颜色”));结束区域= flu.Properties.VarNames (2: end-1);传奇(地区,“位置”,“西北”);

图包含一个坐标轴对象。坐标轴对象包含18行类型的对象。这些对象代表NE MidAtl ENCentral, WNCentral, SAtl, ESCentral, WSCentral, Mtn, Pac。

图显示每个回归线都有不同的截距和斜率。

适合使用单一的多元回归模型 n ——- - - - - - P 所有反应维度设计矩阵。

加载示例数据。

负载(“流感”)

数据集的数组流感包含国家流感疾病预防控制中心估计,九个独立的地区估计基于Google®查询。

提取和预测数据的响应。

Y =双(流感(:2:end-1));[n、d] = (Y)大小;x = flu.WtdILI;

的反应Y九个地区流感估计。每周观测存在一段时间, n = 52。反应的尺寸对应的区域,所以 d = 9。的预测因素x每周的国家流感估计。

创建一个 n ——- - - - - - P 设计矩阵X。添加一个列包含一个常数项的回归。

X =[(大小(X)), X);

多元回归模型

y j = α j + β j x j + ϵ j ,

在哪里 = 1 , , n j = 1 , , d ,between-region并发相关

C O V ( ϵ j , ϵ j ) = σ j j

有18个回归系数估计:九拦截,斜率和9项。

[β,σ,E, CovB logL] = mvregress (X, Y);

β包含的估计 P ——- - - - - - d 系数矩阵。σ包含的估计 d ——- - - - - - d variance-covariance between-region并发相关性矩阵。E是一个矩阵的剩余工资。CovB回归系数的估计variance-covariance矩阵。logL后的对数似然目标函数的值是最后的迭代。

画出拟合回归模型。

B =β;xx = linspace (5, 3.5);适合=[(大小(xx)), xx] * B;图h =情节(x, Y,“x”xx,适合“- - -”);i = 1: d组(h (d + i),“颜色”get (h(我),“颜色”))结束区域= flu.Properties.VarNames (2: end-1);传奇(地区,“位置”,“西北”)

图包含一个坐标轴对象。坐标轴对象包含18行类型的对象。这些对象代表NE MidAtl ENCentral, WNCentral, SAtl, ESCentral, WSCentral, Mtn, Pac。

图显示每个回归线都有不同的截距和斜率。

输入参数

全部折叠

多元回归的设计矩阵,指定为一个矩阵或单元矩阵的数组。n的观测数据,K回归系数估计的数量,p预测变量的数量,d在响应变量矩阵维度的数量吗Y

  • 如果d= 1,然后指定X作为一个单独的n——- - - - - -K设计矩阵。

  • 如果d> 1,所有d尺寸有相同的设计矩阵,然后您可以指定X作为一个单独的n——- - - - - -p设计矩阵(不是单元阵列)。

  • 如果d> 1,所有n观察有相同的设计矩阵,然后您可以指定X作为一个包含单个单元阵列d——- - - - - -K设计矩阵。

  • 如果d> 1,所有n观察没有相同的设计矩阵,然后指定X作为一个单元阵列的长度n包含d——- - - - - -K设计矩阵。

包括回归模型中的常数项,每个设计矩阵应该包含一个列的。

mvregress对待X作为缺失值,忽略了行X用缺失值。

数据类型:||细胞

响应变量指定为一个n——- - - - - -d矩阵。n的观测数据,d响应中维度的数量。当d= 1,mvregress治疗中的值Y就像n独立的响应值。

mvregress对待Y作为缺失值,处理他们根据指定使用名称-值对参数估计算法算法

数据类型:|

名称-值参数

指定可选的双参数作为Name1 = Value1,…,以=家,在那里的名字参数名称和吗价值相应的价值。名称-值参数必须出现在其他参数,但对的顺序无关紧要。

R2021a之前,用逗号来分隔每一个名称和值,并附上的名字在报价。

例子:“算法”、“cwls’,‘covar0’, C指定covariance-weighted使用协方差矩阵最小二乘估计C

估计算法,指定为逗号分隔组成的“算法”和一个以下。

“mvn” 普通多元正态最大似然估计。
ecm的 最大似然估计通过ECM算法。
“cwls” Covariance-weighted最小二乘估计。

默认的算法依赖于存在缺失的数据。

  • 对于完整的数据,默认“mvn”

  • (如果有任何遗漏的响应),缺省值是ecm的提供了样本容量足够,估计所有参数。否则,默认的算法“cwls”

请注意

如果算法的值“mvn”,然后mvregress删除观测与估计之前失踪的响应值。

例子:“算法”、“ecm的

初步估计回归系数,指定为逗号分隔组成的“beta0”和一个向量K元素。默认值为0的向量。

beta0如果估计参数是不习惯算法“mvn”

初步估计variance-covariance矩阵,σ,指定为逗号分隔两人组成的“covar0”和一个对称、正定d——- - - - - -d矩阵。默认值为单位矩阵。

如果估计算法“cwls”,然后mvregress使用covar0在每步迭代加权矩阵,在不改变它。

类型的variance-covariance矩阵估算一下Y,指定为逗号分隔两人组成的“covtype”和一个以下。

“全部” 估计所有d(d+ 1)/ 2 variance-covariance元素。
“对角线” 估计只有dvariance-covariance矩阵的对角元素。

例子:“covtype”、“对角线”

最大数量的迭代估计算法,指定为逗号分隔组成的“麦克斯特”和一个正整数。

迭代收敛公差内持续到估计tolbetatolobj或指定的最大迭代数麦克斯特是达到了。如果两个tolbetatolobj是0,那么mvregress执行麦克斯特迭代不收敛性测试。

例子:“麦克斯特”,50岁

函数来评估在每个迭代中,指定为逗号分隔组成的“outputfcn”和一个函数处理。函数必须返回一个逻辑真正的。在每一次迭代,mvregress评估函数。如果结果是真正的,迭代停止。否则,迭代继续。例如,您可以指定一个函数,它的情节或显示当前迭代的结果,并返回真正的如果你关闭图。

函数必须接受三个输入参数,按照这个顺序:

  • 向量的电流系数估计

  • 结构包含这三个字段:

    柯伐合金 当前值的variance-covariance矩阵
    迭代 当前迭代次数
    fval loglikelihood目标函数的当前值

  • 文本,这三个值:

    “init” 只有在函数被调用时,在初始化
    “通路” 当迭代后的函数被调用
    “完成” 当函数被调用后完成

为回归系数收敛公差,指定为逗号分隔组成的“tolbeta”和积极的标量值。

b t 表示估计系数向量的迭代t, τ β 被指定的公差tolbeta。回归系数估计的收敛性判据

b t b t 1 < τ β K ( 1 + b t ) ,

在哪里K的长度是 b t v 是一个向量的规范 v

迭代收敛公差内持续到估计tolbetatolobj或指定的最大迭代数麦克斯特是达到了。如果两个tolbetatolobj是0,那么mvregress执行麦克斯特迭代不收敛性测试。

例子:e-5 tolbeta, 1

loglikelihood目标函数收敛公差,指定为逗号分隔组成的“tolobj”和积极的标量值。

l t 表示在迭代loglikelihood目标函数的值t, τ 被指定的公差tolobj。目标函数的收敛性判据

| l t l t 1 | < τ ( 1 + | l t | )

迭代收敛公差内持续到估计tolbetatolobj或指定的最大迭代数麦克斯特是达到了。如果两个tolbetatolobj是0,那么mvregress执行麦克斯特迭代不收敛性测试。

例子:e-5 tolobj, 1

格式的参数估计variance-covariance矩阵,CovB,指定为逗号分隔两人组成的“varformat”和一个以下。

“β” 返回的variance-covariance矩阵只有回归系数的估计,β
“全部” 返回variance-covariance矩阵的回归系数的估计,βvariance-covariance矩阵估计,σ

例子:“varformat”,“全部”

类型的variance-covariance矩阵参数估计,指定为逗号分隔组成的“vartype”,要么“海赛”“雪”

  • 如果该值为“海赛”,然后mvregress使用麻绳或观察到的信息,矩阵计算CovB

  • 如果该值为“雪”,然后mvregress使用完整的数据费雪,或预期信息,矩阵计算CovB

“海赛”方法考虑了由于缺失数据不确定性增加,虽然“雪”方法不。

例子:“vartype”、“费雪的

输出参数

全部折叠

估计回归系数,作为一个列向量或矩阵返回。

  • 如果您指定X作为一个单独的n——- - - - - -K设计矩阵,然后mvregress返回β一个列向量的长度K。例如,如果X是一个20-by-5设计矩阵,然后呢β是一个5-by-1列向量。

  • 如果您指定X作为一个包含一个或多个单元阵列d——- - - - - -K设计矩阵,然后mvregress返回β一个列向量的长度K。例如,如果X是一种含有2-by-10单元阵列设计矩阵,然后呢β是一个10-by-1列向量。

  • 如果您指定X作为一个单独的n——- - - - - -p设计矩阵(不是单元阵列)Y有尺寸d> 1,那么mvregress返回β作为一个p——- - - - - -d矩阵。例如,如果X是一个20-by-5设计矩阵,然后呢Y有两个维度,这样吗d= 2,然后β是一个5×2矩阵和安装吗Y值是X×β

估计variance-covariance矩阵的反应Y,返回d——- - - - - -d方阵。

请注意

估计variance-covariance矩阵,σ没有剩余的样本协方差矩阵矩阵,E

拟合回归模型的残差,作为一个返回n——- - - - - -d矩阵。

如果算法的值ecm的“cwls”,然后mvregress在计算相对应的剩余价值缺失值Y之间的差异有条件地估算值和拟合值。

请注意

如果算法的值“mvn”,然后mvregress删除观测与估计之前失踪的响应值。

参数估计variance-covariance矩阵,作为一个方阵返回。

  • 如果varformat的值“β”(默认)CovB是估计variance-covariance矩阵的系数估计β

  • 如果varformat的值“全部”,然后CovB是估计variance-covariance矩阵估计相结合的βσ

最后一次迭代后,返回Loglikelihood目标函数值作为一个标量值。

更多关于

全部折叠

多元正态回归

多元正态回归的回归d维响应设计矩阵的预测变量,与正态分布的错误。错误可以异方差的和相关的。

模型是

y = X β + e , = 1 , , n ,

在哪里

  • y 是一个d维向量的反应。

  • X 是一个设计矩阵的预测变量。

  • β 回归系数向量或矩阵。

  • e 是一个d维向量误差,多元正态分布

    e ~ V N d ( 0 , Σ )

有条件地估算值

期望/条件最大化(ecm的)和covariance-weighted最小二乘(“cwls”)估计算法包括污名失踪的响应值。

y ˜ 表示失踪的观察。有条件地估算值的期望值失踪的观察观测数据, Ε ( y ˜ | y )

失踪的联合分布和观察到的响应是一个多元正态分布,

( y ˜ y ) ~ V N { ( X ˜ β X β ) , ( Σ y ˜ Σ y ˜ y Σ y y ˜ Σ y ) }

使用多元正态分布的特性,给出了估算条件期望

Ε ( y ˜ | y ) = X ˜ β + Σ y ˜ y Σ y 1 ( y X β )

请注意

mvregress只有背景失踪的响应值。观察用缺失值设计矩阵中删除。

引用

[1],罗德里克·j。,唐纳德·b·鲁宾。缺失的数据统计分析。第二版,霍博肯,台北:约翰·威利& Sons Inc ., 2002年。

[2]孟,小李和唐纳德·b·鲁宾。“通过ECM算法的最大似然估计。”生物统计学。2号卷。80年,1993年,页267 - 278。

[3]教堂司事,乔和a·r·斯文森。“ECM算法收敛的速度。”生物统计学。3号卷。87年,2000年,页651 - 662。

[4]的法官,a P。,N。米。laird, and D. B. Rubin. “Maximum Likelihood from Incomplete Data via the EM Algorithm.”英国皇家统计学会杂志》上。系列B, 39卷,1号,1977,pp。1-37。

版本历史

介绍了R2006b