交叉表

交叉制表

描述

TBL=交叉(X1X2返回交叉列表,TBL中,相同长度的两个矢量,X1X2

TBL=交叉(X1,...,XN返回一个多维交叉列表,TBL,对于多个输入向量数据,X1X2,...,XN

[TBL卡方p] =交叉(___还返回卡方统计量,卡方,其p-值,p,对于测试TBL独立于每个维度。你可以使用任何以前的语法。

[TBL卡方p标签] =交叉(___还返回一个单元阵列,标签,它包含标签为每个输入参数中的一列,X1...XN

例子

全部收缩

创建两个样本数据向量,包含三个和四个不同的值,分别。

X = [1 1 2 3 1];Y = [1 2 5 3 1];

交叉制表Xÿ

表=交叉(X,Y)
表=3×42 1 0 0 0 0 0 1 0 0 1 0

在该行对应于三个不同的值X,而列对应于四个不同的值ÿ

生成两个独立的载体,X1X2,每个包含在范围50张离散均匀随机数1:3

RNG默认;%,持续重现X1 = unidrnd(3,50,1);X2 = unidrnd(3,50,1);

交叉制表X1X2

[表,χ2,P] =交叉(X1,X2)
表=3×31 6 7 5 5 2 11 7 6
χ2 = 7.5449
p值= 0.1097

返回p的价值0.1097表明,在5%的显着性水平,交叉表不能拒绝零假设,即独立于每个维度。

加载样本数据,其中包含在年1970-1982的大型汽车模型测量。

加载carbig

交叉制表的四缸车的数据(CYL4)根据车型年(什么时候)和原产国(组织)。

[表,χ2,P,标签] =交叉(CYL4,何时,ORG);

采用标签以确定在索引位置为在数据的后期在美国制造四缸汽车的数量。

标签
标签=3×3单元阵列{ '其他'} { '早期'} { 'USA'} { '四大'} { '中'} { '欧洲'} {为0x0双} { '晚'} { '日本'}

第一列标签对应于数据CYL4,并表示该行2包含有四个汽缸的汽车数据。第二列标签对应于数据什么时候,并指示该列3包含在后期制造的汽车数据。第三列标签对应于数据组织,并指示该位置1的第三尺寸的包含在美国制造汽车的数据。

因此,表(2,3,1)包含在后期在美国制造的四缸车的数量。

表(2,3,1)
ANS = 38

该数据包含在后期在美国制造38四汽缸汽车。

加载医院的数据。

加载医院

医院数据集数组包含100周医院的病人数据,包括姓名,性别,年龄,体重,吸烟状况,以及收缩期和舒张期血压测量。

要确定是否吸烟状况是独立的性别,使用交叉表创建吸烟者和非吸烟者的2×2列联表,按性别分组。

[TBL,χ2,P,标签] =交叉(hospital.Sex,hospital.Smoker)
TBL =2×240 13 26 21
χ2 = 4.5083
p值= 0.0337
标签=2×2单元{ '女'} { '0'} { '男'} { '1'}

所得偶然性表中的行TBL对应于患者的性别,用含有数据为女性行1和包含的数据为男性行2。列对应于患者的吸烟状态,用含有数据非吸烟者塔1和包含的数据为吸烟者塔2。返回的结果χ2 = 4.5083是卡方检验统计量独立性的Pearson卡方检验的价值。返回值p值= 0.0337是一个近似 p - 值基于卡方分布。

输入参数

全部收缩

输入矢量,指定为分组变量的矢量。所有的输入矢量,其中包括X1X2,...,XN必须是相同的长度。

数据类型:||烧焦||合乎逻辑

输入矢量,指定为分组变量的矢量。所有的输入矢量,其中包括X1X2,...,XN必须是相同的长度。

数据类型:||烧焦||合乎逻辑

输入矢量,指定为分组变量的矢量。如果您使用此语法指定超过两个输入向量,则交叉表生成多维交叉列表表。所有的输入矢量,其中包括X1X2,...,XN必须是相同的长度。

数据类型:||烧焦||合乎逻辑

输出参数

全部收缩

交叉列表表,返回作为整数值的矩阵。

如果指定了两个输入向量,X1X2, 然后TBL是一个-通过-ñ矩阵,其中是不同的值的数X1ñ是不同的值的数X2

如果指定了三个或更多的输入向量,则TBL(I,J,...,N)是指数,其中的计数grp2idx(X1)一世grp2idx(X2)Ĵgrp2idx(X3)ķ, 等等。

卡方统计,返回的是一个积极的标量值。零假设是,在任何项目的比例TBL是在每一维的比例的产物。

为卡方检验统计p值,返回的范围的标量值[0,1]交叉表测试,TBL独立于每个维度。

数据标签,返回为单元阵列。在第一列中的条目是一排排标签TBL,在第二列中的条目列的标签,等等,对于一个多维TBL

算法

  • 交叉表使用grp2idx为正整数分配给每个不同的值。TBL(I,J)是指数,其中的计数grp2idx(X1)一世grp2idx(X2)Ĵ。的数字顺序grp2idx(X1)grp2idx(X2)为了行和列TBL, 分别。

    在这种情况下,返回的值TBL(I,J,...,N)是指数,其中的计数grp2idx(X1)一世grp2idx(X2)Ĵgrp2idx(X3)ķ, 等等。

  • 交叉表计算p使用的公式是渐近有效的大样本大小的卡方检验统计量 - 值。近似为小样本或不均匀边缘分布的样本不太准确。如果您的样本只包含两个变量,每个有两个层次,你可以使用fishertest代替。这个函数执行Fisher的精确测试,不依赖于大样本分布的假设。

扩展功能

也可以看看

||

主题

R2006a前推出