Wilkinson表示法提供了一种描述回归和重复测量模型的方法,而无需指定系数值。这个专门的符号识别响应变量和预测变量包括或从模型中排除。您还可以包括平方和高阶项,互动方面,该模型公式中的分组变量。GydF4y2Ba
指定使用威尔金森表示法的模型提供了几个优点:GydF4y2Ba
您可以包含或排除模型预测个体和交互方面。例如,使用GydF4y2Ba“互动”GydF4y2Ba
每个模型拟合函数中可用的名称值对包括所有变量对的交互术语。使用Wilkinson表示法允许您仅包括互动的兴趣条款。GydF4y2Ba
如果输入数据使用,则可以在不更改设计矩阵的情况下更改型号公式GydF4y2Ba桌子GydF4y2Ba
数据类型。例如,如果使用所有可用的预测器变量适合初始模型,但决定删除没有统计学意义的变量,则可以重新编写型号公式,仅包括感兴趣的变量。您无需对输入数据本身进行任何更改。GydF4y2Ba
统计和机器学习工具箱™提供了多种模型拟合使用威尔金森表示法,包括功能:GydF4y2Ba
线性模型(使用GydF4y2BaFitlm.GydF4y2Ba
和GydF4y2Ba步骤行程GydF4y2Ba
)GydF4y2Ba
广义线性模型(使用GydF4y2BaFitglm.GydF4y2Ba
)GydF4y2Ba
线性混合效应模型(使用GydF4y2Bafitlme.GydF4y2Ba
和GydF4y2BafitlmematrixGydF4y2Ba
)GydF4y2Ba
广义的线性混合效果模型(使用GydF4y2BaFitglme.GydF4y2Ba
)GydF4y2Ba
重复测量模型(使用GydF4y2BaFitrm.GydF4y2Ba
)GydF4y2Ba
Cox比例风险模型(使用GydF4y2BaFitcox.GydF4y2Ba
)GydF4y2Ba
一种用于模型规范公式的形式为一个字符向量或标量串GydF4y2BaY〜条款GydF4y2Ba
, 在哪里GydF4y2BayGydF4y2Ba
是响应变量的名称,以及GydF4y2Ba术语GydF4y2Ba
定义了使用预测器变量名和以下运算符模型。GydF4y2Ba
预测在条款模式GydF4y2Ba | Wilkinson表示法GydF4y2Ba |
---|---|
截距GydF4y2Ba | 1GydF4y2Ba |
没有拦截GydF4y2Ba | -1GydF4y2Ba |
XGydF4y2Ba1GydF4y2Ba | X1GydF4y2Ba |
XGydF4y2Ba1GydF4y2Ba那GydF4y2BaXGydF4y2Ba2GydF4y2Ba | X1 + X2GydF4y2Ba |
XGydF4y2Ba1GydF4y2Ba那GydF4y2BaXGydF4y2Ba2GydF4y2Ba那GydF4y2BaXGydF4y2Ba1GydF4y2BaXGydF4y2Ba2GydF4y2Ba | x1 * x2GydF4y2Ba 或者GydF4y2BaX1 + X2 + X1:X2GydF4y2Ba |
XGydF4y2Ba1GydF4y2BaXGydF4y2Ba2GydF4y2Ba | x1:x2GydF4y2Ba |
XGydF4y2Ba1GydF4y2Ba那GydF4y2BaXGydF4y2Ba1GydF4y2Ba2GydF4y2Ba | x1 ^ 2GydF4y2Ba |
XGydF4y2Ba1GydF4y2Ba2GydF4y2Ba | X1 ^ 2 - X1GydF4y2Ba |
威尔金森表示法包括默认模型中的截距项,即使你不添加1到模型公式。从模型中排除的截距,使用-1在公式中。GydF4y2Ba
这GydF4y2Ba*GydF4y2Ba
运算符(相互作用)和GydF4y2Ba^GydF4y2Ba
运算符(用于功率和指数)自动包括所有较低阶项。例如,如果您指定GydF4y2BaX ^ 3GydF4y2Ba
,该模型将自动包含GydF4y2BaXGydF4y2Ba3.GydF4y2Ba那GydF4y2BaXGydF4y2Ba2GydF4y2Ba, 和GydF4y2BaXGydF4y2Ba。如果你想从模型中排除某些变量,使用GydF4y2Ba-GydF4y2Ba
操作删除不需要的条款。GydF4y2Ba
对于随机效果和混合效果模型,公式规范包括预测变量的名称和分组变量。例如,如果预测器变量GydF4y2BaXGydF4y2Ba1GydF4y2Ba是随机效应由可变分组GydF4y2BaGGydF4y2Ba然后在Wilkinson符号中代表这一点,如下所示:GydF4y2Ba
(X1 |克)GydF4y2Ba
重复测量模型中,公式规范包括所有的重复测量作为响应,并作为预测变量的因素。为如下表所述指定重复测量模型的响应变量。GydF4y2Ba
在模型响应条款GydF4y2Ba | Wilkinson表示法GydF4y2Ba |
---|---|
yGydF4y2Ba1GydF4y2Ba | y1.GydF4y2Ba |
yGydF4y2Ba1GydF4y2Ba那GydF4y2BayGydF4y2Ba2GydF4y2Ba那GydF4y2BayGydF4y2Ba3.GydF4y2Ba | Y1,Y2,Y3GydF4y2Ba |
yGydF4y2Ba1GydF4y2Ba那GydF4y2BayGydF4y2Ba2GydF4y2Ba那GydF4y2BayGydF4y2Ba3.GydF4y2Ba那GydF4y2BayGydF4y2Ba4.GydF4y2Ba那GydF4y2BayGydF4y2Ba5.GydF4y2Ba | Y1-Y5.GydF4y2Ba |
举例来说,如果你有三个重复的措施,响应和因素GydF4y2BaXGydF4y2Ba1GydF4y2Ba那GydF4y2BaXGydF4y2Ba2GydF4y2Ba, 和GydF4y2BaXGydF4y2Ba3.GydF4y2Ba作为预测变量,那么你就可以使用威尔金森符号如下定义重复测量模型:GydF4y2Ba
Y1,Y2,Y3GydF4y2Ba〜GydF4y2BaX1GydF4y2Ba+GydF4y2BaX2GydF4y2Ba+GydF4y2BaX3GydF4y2Ba
或者GydF4y2Ba
Y1,Y3〜X1 + X2 + X3GydF4y2Ba
如果输入数据(响应和预测变量)被存储在一个表或数据集阵列,可以指定使用的变量名的公式。例如,加载GydF4y2BaCarsmall.GydF4y2Ba
样本数据。创建包含一个表GydF4y2Ba重量GydF4y2Ba
那GydF4y2Ba加速GydF4y2Ba
, 和GydF4y2BaMPG.GydF4y2Ba
。使用该名称的每个变量GydF4y2Ba'variablenames'GydF4y2Ba
拟合函数的名称 - 值对参数GydF4y2BaFitlm.GydF4y2Ba
。然后将以下模型适合数据:GydF4y2Ba
加载GydF4y2BaCarsmall.GydF4y2BaTBL =表(重量,加速度,MPG,GydF4y2Ba......GydF4y2Ba'variablenames'GydF4y2Ba,{GydF4y2Ba'重量'GydF4y2Ba那GydF4y2Ba'加速'GydF4y2Ba那GydF4y2Ba'MPG'GydF4y2Ba});MDL = fitlm(TBL,GydF4y2Ba'MPG〜重量+加速'GydF4y2Ba)GydF4y2Ba
MDL =线性回归模型:MPG〜1个+重量+加速度估计系数:估计SE TSTAT p值__________ _______ __________(截距)45.155 3.4659 13.028 1.6266e-22重量-0.0082475 0.00059836 -13.783 5.3165e-24加速0.19694 0.14743 1.3359 0.18493数的观察结果:94,自由的误差度:91均方根误差:4.12 R平方:0.743,调整R平方:0.738 F统计与常数模型:132,p值= 1.38E-27GydF4y2Ba
模型对象显示使用在输入表中提供的变量名。GydF4y2Ba
如果将输入数据存储为矩阵,则可以使用默认变量名称指定公式,例如GydF4y2BayGydF4y2Ba
那GydF4y2BaX1GydF4y2Ba
, 和GydF4y2BaX2GydF4y2Ba
。例如,加载GydF4y2BaCarsmall.GydF4y2Ba
样本数据。创建包含预测变量的矩阵GydF4y2Ba重量GydF4y2Ba
和GydF4y2Ba加速GydF4y2Ba
。然后将以下模型适合数据:GydF4y2Ba
加载GydF4y2BaCarsmall.GydF4y2BaX = [重量,加速];Y = MPG;MDL = fitlm(X,Y,GydF4y2Ba'Y〜X1 + X2'GydF4y2Ba)GydF4y2Ba
MDL =线性回归模型为:y〜1个+ X1 + X2估计系数:估计SE TSTAT p值__________ _______ __________(截距)45.155 3.4659 13.028 1.6266e-22 X1 -0.0082475 0.00059836 -13.783 5.3165e-24×2 0.19694 0.14743 1.3359 0.18493数的观察结果:94,自由的误差度:91均方根误差:4.12 R平方:0.743,调整R平方:0.738 F统计与常数模型:132,p值= 1.38E-27GydF4y2Ba
期限GydF4y2BaX1GydF4y2Ba
在模型规格公式对应于预测变量矩阵的第一列GydF4y2BaXGydF4y2Ba
。期限GydF4y2BaX2GydF4y2Ba
对应于输入矩阵的第二列。期限GydF4y2BayGydF4y2Ba
对应于响应变量。GydF4y2Ba
用GydF4y2BaFitlm.GydF4y2Ba
和GydF4y2Ba步骤行程GydF4y2Ba
以适应线性模型。GydF4y2Ba
对于具有截距和两个固定效果预测器的线性回归模型,例如GydF4y2Ba
指定使用威尔金森符号如下模型公式:GydF4y2Ba
'Y〜X1 + X2'GydF4y2Ba
对于没有截距和两个固定效果预测器的线性回归模型,例如GydF4y2Ba
指定使用威尔金森符号如下模型公式:GydF4y2Ba
'Y〜-1 + X1 + X2'GydF4y2Ba
对于线性回归模型截距,两个固定效果预测,和一个相互作用项,如GydF4y2Ba
指定使用威尔金森符号如下模型公式:GydF4y2Ba
'Y〜X1 * X2'GydF4y2Ba
或者GydF4y2Ba
'y〜x1 + x2 + x1:x2'GydF4y2Ba
对于具有截距的线性回归模型,三个固定效果预测器和所有三个预测器之间的交互效应以及所有低阶项,例如GydF4y2Ba
指定使用威尔金森符号如下模型公式:GydF4y2Ba
'Y〜X1 * X2 * X3'GydF4y2Ba
对于线性回归模型截距,三个固定效果预测,以及互动效应两个预测器之间,如GydF4y2Ba
指定使用威尔金森符号如下模型公式:GydF4y2Ba
'Y〜X1 * X2 + X3'GydF4y2Ba
或者GydF4y2Ba
'Y〜X1 + X2 + X3 + X1:X2'GydF4y2Ba
对于线性回归模型截距,三个固定效果预测,并且所有三个预测器之间的成对相互作用的影响,但同时不包括所有的三个预测器之间的相互作用的效果,如GydF4y2Ba
指定使用威尔金森符号如下模型公式:GydF4y2Ba
'Y〜X1 * X2 * X3 - X1:X2:X3'GydF4y2Ba
用GydF4y2Bafitlme.GydF4y2Ba
和GydF4y2BafitlmematrixGydF4y2Ba
以适应线性混合效应模型。GydF4y2Ba
对于线性混合效应模型,该模型包含随机截距但没有预测的术语,例如GydF4y2Ba
在哪里GydF4y2Ba
和GydF4y2BaGGydF4y2Ba是与所述分组变量GydF4y2BamGydF4y2Ba水平,如下指定使用威尔金森符号模型公式:GydF4y2Ba
'Y〜(1 | g)'GydF4y2Ba
对于线性混合效应模型,其中包含一个固定的拦截,随机截距和用于连续预测变量固定斜率,如GydF4y2Ba
在哪里GydF4y2Ba
和GydF4y2BaGGydF4y2Ba是与所述分组变量GydF4y2BamGydF4y2Ba水平,如下指定使用威尔金森符号模型公式:GydF4y2Ba
'Y〜X1 +(1 | G)'GydF4y2Ba
对于线性混合效应模型,其中包含一个固定的截距,加上随机截距和具有它们之间的可能的相关的随机坡度,如GydF4y2Ba
在哪里GydF4y2Ba
和GydF4y2BaD.GydF4y2Ba是一个2×2的对称和半正定协方差矩阵,通过方差分量矢量θ参数,指定用威尔金森符号如下模型公式:GydF4y2Ba
'y〜x1 +(x1 | g)'GydF4y2Ba
随机效应协方差矩阵的图案是通过模型拟合函数来确定。要指定协方差矩阵模式,使用的名称 - 值对可通过GydF4y2Bafitlme.GydF4y2Ba
拟合模型时。例如,可以指定这样的假设随机截距和斜率随机彼此独立使用的GydF4y2Ba'covariancepattern'GydF4y2Ba
名称 - 值对的参数中GydF4y2Bafitlme.GydF4y2Ba
。GydF4y2Ba
用GydF4y2BaFitglm.GydF4y2Ba
和GydF4y2Ba挺身油GydF4y2Ba
适合广义线性模型。GydF4y2Ba
在广义线性模型中,GydF4y2BayGydF4y2Ba响应变量具有除正常之外的分布,但您可以将模型表示为回归系数中线性的等式。指定广义的线性模型需要三个部分:GydF4y2Ba
分布响应变量GydF4y2Ba
链接功能GydF4y2Ba
线性预测GydF4y2Ba
响应变量的分布和链接功能使用拟合功能中的名称值对参数指定GydF4y2BaFitglm.GydF4y2Ba
或者GydF4y2Ba挺身油GydF4y2Ba
。GydF4y2Ba
等式的线性预测器部分,它出现在右侧GydF4y2Ba〜GydF4y2Ba
模型规格式中符号,使用威尔金森符号以同样的方式作为线性模型的例子。GydF4y2Ba
广义线性模型的模型链接功能,而不是实际的回应,GydF4y2BayGydF4y2Ba。这反映在用于模型对象的输出显示。GydF4y2Ba
对于具有截距和两个预测器的广义线性回归模型,例如GydF4y2Ba
指定使用威尔金森符号如下模型公式:GydF4y2Ba
'Y〜X1 + X2'GydF4y2Ba
用GydF4y2BaFitglme.GydF4y2Ba
为了适应广义线性混合效应模型。GydF4y2Ba
在一个广义线性混合效应模型,所述GydF4y2BayGydF4y2Ba响应变量具有除正常之外的分布,但您可以将模型表示为回归系数中线性的等式。指定广义的线性模型需要三个部分:GydF4y2Ba
分布响应变量GydF4y2Ba
链接功能GydF4y2Ba
线性预测GydF4y2Ba
响应变量的分布和链接功能使用拟合功能中的名称值对参数指定GydF4y2BaFitglme.GydF4y2Ba
。GydF4y2Ba
等式的线性预测器部分,它出现在右侧GydF4y2Ba〜GydF4y2Ba
模型规格式中符号,使用威尔金森符号以同样的方式作为用于线性混合效应模型的例子。GydF4y2Ba
广义线性模型,模型的链接功能GydF4y2BayGydF4y2Ba,不响应本身。这反映在用于模型对象的输出显示。GydF4y2Ba
随机效应协方差矩阵的图案是通过模型拟合函数来确定。要指定协方差矩阵模式,使用的名称 - 值对可通过GydF4y2BaFitglme.GydF4y2Ba
拟合模型时。例如,可以指定这样的假设随机截距和斜率随机彼此独立使用的GydF4y2Ba'covariancepattern'GydF4y2Ba
名称 - 值对的参数中GydF4y2BaFitglme.GydF4y2Ba
。GydF4y2Ba
对于包含固定截距,随机截距和固定斜率的广义线性混合效果模型,用于连续预测变量,可以使用泊松分布(例如)使用泊松分布进行建模响应GydF4y2Ba
在哪里GydF4y2Ba
和GydF4y2BaGGydF4y2Ba是与所述分组变量GydF4y2BamGydF4y2Ba水平,如下指定使用威尔金森符号模型公式:GydF4y2Ba
'Y〜X1 +(1 | G)'GydF4y2Ba
用GydF4y2BaFitrm.GydF4y2Ba
适合重复措施模型。GydF4y2Ba
对于具有五个响应测量和一个预测变量的重复测量模型,用威尔金森符号如下指定模型式:GydF4y2Ba
'Y1-Y5〜X1'GydF4y2Ba
对于具有五个响应测量和三个预测变量,外加两个预测变量之间的相互作用的重复测量模型,用威尔金森符号如下指定模型式:GydF4y2Ba
'Y1-Y5〜X1 * X2 + X3'GydF4y2Ba
[1]威尔金森,G.N。,和C. E.罗杰斯。“因模型的符号描述为方差分析。”GydF4y2BaJ.皇家统计学会GydF4y2Ba22,第392-399,1973。GydF4y2Ba