主要内容

Compact一项式标Model.

紧凑型广义线性回归模型类

描述

Compact一项式标Model.是一个完整的广义线性回归模型对象的压缩版本吗GeneralizedLinearModel。因为紧凑的模型不存储用于适合拟合过程相关的模型或信息的输入数据,所以aCompact一项式标Model.对象占用的内存少于GeneralizedLinearModel对象。您仍然可以使用紧凑的模型来预测使用新输入数据的响应,但有些GeneralizedLinearModel对象函数不适用于紧凑的模型。

创建

创建一个Compact一项式标Model.从充分培训的模型GeneralizedLinearModel模型通过使用袖珍的

Fitglm.返回Compact一项式标Model.当你使用高阵列和返回时GeneralizedLinearModel当您使用内存表和数组时。

特性

展开全部

系数估计

此属性是只读的。

系数估计的协方差矩阵,指定为ap-经过-p矩阵的数值。p为拟合模型中的系数个数。

有关详细信息,请参见系数、标准误差和置信区间

数据类型:单身的|双倍的

此属性是只读的。

系数名称,指定为字符向量的小区数组,每个传感器阵列包含相应项的名称。

数据类型:细胞

此属性是只读的。

系数值,指定为表。系数包含一行为每个系数和这些列:

  • 估计- 估计系数值

  • SE- 估计的标准错误

  • Tstat.- - - - - -t-统计量用于测试系数为零

  • pvalue.- - - - - -p- 为valuet-统计

使用方差分析(仅用于线性回归模型)或coefTest对系数进行其他测试。使用coefCI求系数估计值的置信区间。

要获得这些列中的任何一个向量,请使用点表示法索引属性。例如,得到模型中估计的系数向量mdl:

β= mdl.Coefficients.Estimate

数据类型:表格

此属性是只读的。

模型系数的数量,指定为正整数。NumCoefficients包括当模型项秩亏时被设置为零的系数。

数据类型:双倍的

此属性是只读的。

模型中估计系数的数量,指定为正整数。numestimatedcoeffients.当模型术语缺陷时,不包括设置为零的系数。numestimatedcoeffients.是回归的自由度。

数据类型:双倍的

摘要统计信息

此属性是只读的。

拟合的偏差,指定为数值。当一个模型是另一个模型的特殊情况时,偏差对于比较两个模型非常有用。两种模型的偏差之间的差异具有Chi-Square分布,具有等于两种模型之间估计参数数量的差异的自由度。有关更多信息,请参阅偏见

数据类型:单身的|双倍的

此属性是只读的。

错误的自由度(残差),等于观察次数减去估计系数的数量,指定为正整数。

数据类型:双倍的

此属性是只读的。

响应的方差的比例因子,指定为一个数字标量。

如果'DispersensionFlag'的名称-值对参数Fitglm.挺身油真正的,然后该功能估计分散比例因子在计算方差的响应。响应的方差等于理论方差乘以比例因子。

例如,二项份分布的方差函数是p(1 -p) /n, 在哪里p是概率参数和n为样本大小参数。如果分散近了1,数据的方差似乎与二项式分布的理论方差一致。如果分散大于1,数据集相对于二项分布是“过分散”的。

数据类型:双倍的

此属性是只读的。

标记,以指示是否Fitglm.用过分散缩放因子计算标准误差的系数系数。SE,指定为一个逻辑值。如果DispersionEstimated,Fitglm.使用了方差的理论价值。

  • DispersionEstimated可以仅适用于二项式和泊松分布。

  • DispersionEstimated通过设置'DispersensionFlag'的名称-值对参数Fitglm.挺身油

数据类型:逻辑

此属性是只读的。

响应值的模型分布的loglikihie,指定为数值。该平均值从模型中装配,并且估计其他参数作为模型适合的一部分。

数据类型:单身的|双倍的

此属性是只读的。

模型比较标准指定为具有这些字段的结构:

  • 另类投资会议-赤池信息标准。AIC = -2 * logl + 2 * m, 在哪里logL对数似然和是估计参数的数量。

  • AICC.- Akaike信息标准校正样本大小。AICc = AIC + (2*m*(m + 1))/(n - m - 1), 在哪里n是观察人数。

  • BIC- 贝叶斯信息标准。BIC = -2 *logL + m*log(n)

  • 中安集团经贸- 一致的akaike信息标准。caic = -2 * logl + m *(log(n)+ 1)

信息条件是您可以使用的模型选择工具,以比较多个模型适合相同的数据。这些标准是基于可能性的模型拟合措施,包括复杂性的惩罚(具体地,参数的数量)。不同的信息标准通过罚款的形式来区分。

当您比较多个模型时,具有最低信息标准值的模型是最合适的模型。最佳拟合模型可以根据用于模型比较的标准而变化。

要以标量形式获得任何标准值,请使用点表示法将其索引到属性中。例如,获取AIC值另类投资会议在模型中mdl:

AIC = mdl.modelcrertion.aic.

数据类型:结构体

此属性是只读的。

模型的R线值,指定为具有五个字段的结构。

描述 方程
普通的 普通(调整)的平方

R 普通的 2 = 1 上交所 风场

上交所是平方误差的总和,和风场是响应向量相对于响应向量均值的偏差平方和的总和。

调整 r²根据系数数进行了调整

R 调整 2 = 1 上交所 风场 N 1 教育部

N是观察到的数量(NumObservations),教育部是错误的自由度(残差)。

llr. Loglikelihood比率

R llr. 2 = 1 l l 0

l是拟合型号的loglikihie(loglikelihie),l0是模型的loglikelihie,该模型仅包含一个常数术语。R2llr.麦克法登伪r平方值是多少[1]对于Logistic回归模型。

偏见 偏差平方

R 偏见 2 = 1 D D 0

D是拟合型号的偏差(偏见),D0是只包含一个常数项的模型的偏差。

AdjGeneralized 调整的广义R角

R AdjGeneralized 2 = 1 经验值 ( 2 ( l 0 l ) N ) 1 经验值 ( 2 l 0 N )

R2AdjGeneralized是Nagelkerke调整吗[2]到Maddala提出的公式[3]考克斯和斯奈尔[4],麦基[5]对于Logistic回归模型。

要将这些值作为标量,请使用点表示法索引到属性中。例如,为了在模型中获得调整的R线值mdl,输入:

r2 = mdl.Rsquared.Adjusted

数据类型:结构体

此属性是只读的。

被指定为数值的平方误差(残差)之和。

数据类型:单身的|双倍的

此属性是只读的。

成分的回归和指定为数值。正方形的回归和等于从其平均值的拟合值的平方偏差之和。

数据类型:单身的|双倍的

此属性是只读的。

总线总和,指定为数值。正方形总和等于响应矢量的平方偏差之和y来自意思是(y)

数据类型:单身的|双倍的

输入数据

此属性是只读的。

广义分布信息,指定为具有该表中描述的字段的结构。

描述
名称 分发的名称:“正常”,“二”,'泊松',“伽马”, 或者逆高斯分布的
脱良功能 作为拟合参数值和响应值的函数计算偏差分量的函数
VarianceFunction 以拟合参数值为函数计算分布的理论方差的函数。当DispersionEstimated真正的,软件将方差函数乘以分散在计算系数标准错误的计算中。

数据类型:结构体

此属性是只读的。

模型信息,指定为alinearformula对象。

显示拟合模型的公式mdl使用点表示法:

mdl。F或米ula

此属性是只读的。

观察次数拟合用于拟合的拟合功能,指定为正整数。NumObservations原始表、数据集或矩阵中提供的观察数减去任何排除的行(与'排除'名称值对参数)或具有缺失值的行。

数据类型:双倍的

此属性是只读的。

用于适合模型的预测变量数,指定为正整数。

数据类型:双倍的

此属性是只读的。

输入数据中的变量数,指定为正整数。numvarialbles.是原始表或数据集中的变量数,或预测器矩阵和响应向量中的列总数。

numvarialbles.还包括没有作为预测器或响应用于拟合模型的任何变量。

数据类型:双倍的

此属性是只读的。

用于适合模型的预测器的名称,指定为字符向量的单元数组。

数据类型:细胞

此属性是只读的。

响应变量名称,指定为字符向量。

数据类型:char

此属性是只读的。

有关包含在内的变量的信息变量,指定为一个表,每个变量一行,该表中描述的列。

柱子 描述
班级 变量类,指定为字符向量的单元格数组,例如“双”'分类'
范围

可变范围,指定为传感器的单元格数组

  • 连续变量 - 双元素矢量(,马克斯],最小值和最大值

  • 分类变量 - 不同的变量值的矢量

InModel 在拟合模型中变量的指示,指定为一个逻辑向量。这个值是真正的如果模型包含变量。
是基本的 分类变量的指示器,指定为逻辑向量。这个值是真正的如果变量是分类的。

变量税收还包括没有作为预测器或响应用于拟合模型的任何变量。

数据类型:表格

此属性是只读的。

变量的名称,指定为字符向量的小区数组。

  • 如果匹配基于表或数据集,则此属性提供表或数据集中变量的名称。

  • 如果拟合是基于预测矩阵和响应向量,VariableNames控件指定的值“VarNames”拟合方法的名值对参数。的默认值“VarNames”{x1, x2,…,‘xn’,‘y’}

VariableNames还包括没有作为预测器或响应用于拟合模型的任何变量。

数据类型:细胞

对象的功能

展开全部

Feval. 预测广义线性回归模型的响应,每个预测器使用一个输入
预测 预测广义线性回归模型的响应
随机 为广义线性回归模型模拟随机噪声的响应
coefCI 广义线性回归模型系数估计的置信区间
coefTest 广义线性回归模型系数的线性假设检验
devianceTest 广义线性回归模型的偏差分析
partialDependence 计算部分依赖
绘图竞争依赖性 创建部分依赖图(PDP)和个人条件期望图(ICE)
plotslice. 通过拟合广义线性回归曲面的切片图
收集 从GPU中收集机器学习模型的属性

例子

全部折叠

将广义线性回归模型拟合到数据中,通过丢弃样本数据和一些与拟合过程有关的信息来减少完整的拟合模型的大小。

加载largedata4reg数据集,包含15,000个观察数据和45个预测变量。

负载largedata4reg

使用前15个预测器变量将广义线性回归模型拟合到数据。

mdl = fitglm (X (: 1:15), Y);

压缩模型。

compactMdl =紧凑(mdl);

紧凑模型舍弃了原始样本数据和一些与拟合过程有关的信息,比完整模型占用更少的内存。

比较完整模型的尺寸mdl紧凑型模型compactmdl.

var =谁('compactmdl','mdl');[vars(1).bytes,vars(2).bytes]
ans =1×215517 4382500

紧凑型模型消耗比完整模型更少的内存。

更多关于

展开全部

参考

[1]麦克法登,丹尼尔。“有条件的定性选择行为分析。”在经济学中的前沿, P. Zarembka编辑,105-42。纽约:学术出版社,1974。

内格尔科克,新泽西州决定系数一般定义的注记生物统计学78年,没有。3(1991): 691 - 92。

[3] madala, Gangadharrao S。计量经济学中的有限因变量与定性变量。计量经济学社会专著。纽约:剑桥大学出版社,1983。

[4] Cox, D. R.和E. J. Snell。分析二进制数据。第二次。关于统计和应用概率的专着32.伦敦;纽约:1989年Chapman和Hall。

[5]麦基,朗尼。基于Wald和似然比联合显著性检验的r2度量美国统计学家44岁的没有。3(1990年8月):250-53。

扩展能力

介绍了R2016b