主要内容

zscore

标准化z分数

描述

例子

Z= zscore (X)返回z分数为每个元素的X这样的列X中心意思是0和标准偏差1。Z一样的尺寸吗X

  • 如果X是一个矢量,然后呢Z是一个向量的z分数。

  • 如果X是一个矩阵,然后呢Z是一个矩阵的大小一样吗X,每一列的Z意思是0和标准偏差1。

  • 多维数组,z分数在Z计算沿第一个nonsingleton维度X

例子

Z= zscore (X,国旗)尺度X使用标准偏差表示国旗

  • 如果国旗0(默认),那么zscore尺度X使用样本标准差,n- 1在分母上的标准差的公式。zscore (X, 0)是一样的zscore (X)

  • 如果国旗是1,那么zscore尺度X使用总体标准偏差,n在标准差公式的分母。

例子

Z= zscore (X,国旗,'所有')标准化X通过使用的所有值的平均值和标准偏差X

例子

Z= zscore (X,国旗,昏暗的)标准化X在操作层面昏暗的。例如,对于一个矩阵X,如果昏暗的= 1,然后zscore使用均值和标准差的列X,如果昏暗的= 2,然后zscore使用均值和标准差的行X

例子

Z= zscore (X,国旗,vecdim)标准化X在指定的维向量vecdim。例如,如果X是一个矩阵,然后呢zscore (X 0 [1 - 2])相当于zscore (X, 0, '所有')因为一个矩阵的每个元素都包含在定义的数组切片尺寸1和2。

例子

(Z,μ,σ)= zscore (___)均值和标准差也返回用于定心和扩展,μσ,分别。您可以使用任何输入参数的前面的语法。

例子

全部折叠

计算和绘制 z 两个数据向量的分数,然后比较结果。

加载示例数据。

负载lawdata

两个变量加载到工作区:平均绩点考试

情节这两个变量在同一坐标轴。

情节((gpa, lsat))传说(“成绩”,“考试”,“位置”,“东”)

图包含一个坐标轴对象。坐标轴对象包含2线类型的对象。这些对象代表gpa,考试。

很难比较这两个措施,因为他们是在一个非常不同的规模。

画出 z 分数的平均绩点考试在同一坐标轴。

Zgpa = zscore (gpa);Zlsat = zscore(考试);情节([Zgpa Zlsat])传说(“gpa z分数”,“lsat z分数”,“位置”,“东北”)

图包含一个坐标轴对象。坐标轴对象包含2线类型的对象。这些对象代表gpa z分数,考试z得分。

现在,你可以看到的相对表现个人对他们平均绩点考试结果。例如,第三个人平均绩点考试结果都是一个标准偏差低于样本均值。11个人的平均绩点样本均值但有吗考试分数几乎1.25个标准差以上样本的平均水平。

检查的平均值和标准偏差 z 创建分数。

意思是([Zgpa Zlsat])
ans =1×210-14年×-0.1088 - 0.0357
性病([Zgpa Zlsat])
ans =1×21

根据定义, z 分数的平均绩点考试意思是0和标准偏差1。

加载示例数据。

负载lawdata

两个变量加载到工作区:平均绩点考试

计算 z 分数的平均绩点使用人口标准差的公式。

Z1 = zscore (gpa, 1);%的人口公式Z0 = zscore (gpa, 0);%样本公式disp ((Z1 Z0))
1.2554 1.2128 0.8728 0.8432 -1.2100 -1.1690 -0.2749 -0.2656 1.4679 1.4181 -0.1049 -0.1013 -0.4024 -0.3888 1.4254 1.3771 1.1279 1.0896 0.1502 0.1451 0.1077 0.1040 -1.5076 -1.4565 -1.4226 -1.3743 -0.9125 -0.8815 -0.5724 -0.5530

样本人口的总体标准偏差公式 n 在分母上对应于最大似然估计的总体标准偏差,并可能有偏见。样本标准差公式,另一方面,是总体标准差的无偏估计量的一个示例。

计算 z 分数使用平均值和标准偏差计算一个数据矩阵的列或行。

加载示例数据。

负载流感

数据集的数组流感在工作场所被加载。流感有52 11日观测变量。第一个变量包含日期(几周)。其他变量包含流感估计在美国的不同地区

数据数组转换成一个数据矩阵。

flu2 =双(流感(:,2:结束));

新的数据矩阵,flu2,是一个52-by-10双数据矩阵。行对应于周,美国地区列对应数据集的数组流感

每个地区的流感估计(标准化flu2)。

Z1 = zscore (flu2 [], 1);

你可以看到 z 分数在变量编辑器中通过双击矩阵Z1在工作区中创建的。

每周流感估计(标准化flu2)。

Z2 = zscore (flu2 [], 2);

找到一个多维数组的z分数通过指定标准化的数据在不同的维度。比较结果当使用“所有”,昏暗的,vecdim输入参数。

创建一个3-by-4-by-2数组。

X =重塑(一24 [3 4 2])
X = X (:,: 1) = 1 4 7 10 2 5 8 11 3 6 9 12 X(:,: 2) = 13日16日19日22日14 17 20 23日15 18 21 24

标准化X通过使用的所有值的平均值和标准偏差X

Zall = zscore (X 0“所有”)
Zall = Zall (:: 1) = -1.6263 -1.2021 -0.7778 -0.3536 -1.4849 -1.0607 -0.6364 -0.2121 -1.3435 -0.9192 -0.4950 -0.0707 Zall (:,: 2) = 0.0707 0.4950 0.9192 1.3435 0.2121 0.6364 1.0607 1.4849 0.3536 0.7778 1.2021 1.6263

生成的多维数组的z分数意味着0和标准偏差1。例如,计算的平均值和标准偏差Zall

mZall =意味着(Zall (:,:,:)“所有”)
mZall = -9.2519 e-18
sZall =性病(Zall (:,:,:), 0,“所有”)
sZall = 1.0000

现在规范X第二个维度。

Zdim = zscore (X 0 2)
Zdim = Zdim (:: 1) = -1.1619 -0.3873 0.3873 1.1619 -1.1619 -0.3873 0.3873 1.1619 -1.1619 -0.3873 0.3873 1.1619 Zdim (:,: 2) = -1.1619 -0.3873 0.3873 1.1619 -1.1619 -0.3873 0.3873 1.1619 -1.1619 -0.3873 0.3873 1.1619

每一页的每一行的元素Zdim意思是0和标准偏差1。例如,计算出平均值和标准偏差的第二页的第一行Zdim

mZdim =意味着(Zdim (1: 2),“所有”)
mZdim = 0
sZdim =性病(Zdim (1: 2), 0,“所有”)
sZdim = 1

最后,规范X基于第二和第三维度。

Zvecdim = zscore (X 0 3 [2])
Zvecdim = Zvecdim (:: 1) = -1.4289 -1.0206 -0.6124 -0.2041 -1.4289 -1.0206 -0.6124 -0.2041 -1.4289 -1.0206 -0.6124 -0.2041 Zvecdim (:,: 2) = 0.2041 0.6124 1.0206 1.4289 0.2041 0.6124 1.0206 1.4289 0.2041 0.6124 1.0206 1.4289

在每一个元素Zvecdim(我::)片的意思是0和标准偏差1。例如,计算元素的平均值和标准偏差Zvecdim (1::)

mZvecdim =意味着(Zvecdim (1::)“所有”)
mZvecdim = 2.7756 e-17
sZvecdim =性病(Zvecdim (1::), 0,“所有”)
sZvecdim = 1

返回用于计算平均值和标准偏差 z 分数。

加载示例数据。

负载lawdata

两个变量加载到工作区:平均绩点考试

返回 z 分数,意思是,和标准偏差平均绩点

[Z, gpamean, gpastdev] = zscore (gpa)
Z =15×11.2128 0.8432 -1.1690 -0.2656 1.4181 -0.1013 -0.3888 1.3771 1.0896 0.1451⋮
gpamean = 3.0947
gpastdev = 0.2435

输入参数

全部折叠

输入数据,指定为一个向量,矩阵,或多维数组。

数据类型:|

指标计算使用的标准偏差z分数,指定为0或1。

  • 如果国旗0(默认),那么zscore尺度X使用样本标准差zscore (X, 0)是一样的zscore (X)

  • 如果国旗是1,那么zscore尺度X使用总体标准偏差

尺寸来计算z分数的X指定为一个正整数,标量。如果你不指定一个值,那么默认值是第一个数组维度的大小不等于1。

例如,对于一个矩阵X,如果昏暗的= 1,然后zscore使用均值和标准差的列X,如果昏暗的= 2,然后zscore使用均值和标准差的行X

计算向量的维度z分数的X,指定为一个正整数向量。的每个元素vecdim代表一个输入数组的维度X。输出Z一样的尺寸吗X,但意思μ和标准偏差σ每个长度1操作维度。其他尺寸的长度是相同的X,μ,σ

例如,如果X是2-by-3-by-3数组,那么zscore (X 0 [1 - 2])使用均值和标准差的页面X标准化的值X

数据类型:|

输出参数

全部折叠

z -分数,返回为一个向量,矩阵,或多维数组。Z一样的尺寸吗X

的值Z取决于你是否指定“所有”,昏暗的,或vecdim。如果你不指定任何这些输入参数,然后应用下列条件:

  • 如果X是一个矢量,然后呢Z是一个向量的z分数平均值为0,方差为1。

  • 如果X是一个数组,然后呢zscore标准化的第一nonsingleton维度X

一个示例,演示了差异Z当你使用“所有”,昏暗的,vecdim,请参阅多维数组的z得分

的意思是X用于计算z分数,作为一个标量,返回向量,矩阵,或多维数组。μ在指定的操作维度的长度是1。其他尺寸的长度是相同的Xμ

例如,如果X是2-by-3-by-3数组,vecdim(1 2),然后μ是一系列1-by-1-by-3的意思。每个值在μ对应页面的意思X

映射的输入维2-by-3-by-3 1-by-1-by-3输出尺寸

标准偏差的X用于计算z分数,作为一个标量,返回向量,矩阵,或多维数组。σ在指定的操作维度的长度是1。其他尺寸的长度是相同的Xσ

例如,如果X是2-by-3-by-3数组,vecdim(1 2),然后σ是一系列1-by-1-by-3的标准差。每个值在σ对应页面的标准偏差X

映射的输入维2-by-3-by-3 1-by-1-by-3输出尺寸

更多关于

全部折叠

z分数

为一个随机变量X意味着μ和标准差σ,z分数的值x

z = ( x μ ) σ

对样本数据的意思 X ¯ 和标准偏差年代,z数据点的分数x

z = ( x X ¯ ) 年代

z分数衡量一个数据点的距离的平均值的标准偏差。这也被称为标准化的数据。标准化的数据集是0和标准偏差1,和保留形状属性的原始数据集(相同的偏态和峰态)。

您可以使用z分数将数据进一步分析之前相同的规模。这可以让你比较两个或两个以上的数据集有不同的单位。

多维数组

一个多维数组是一个数组有超过两个维度。例如,如果X是一个1-by-3-by-4数组,然后X是一个三维数组。

第一个Nonsingleton维度

一个第一个nonsingleton维度数组的第一维的大小不等于1。例如,如果X是1-by-2-by-3-by-4数组,第二个维度是第一nonsingleton维度的X

样本标准差

样本标准差年代是由

年代 = = 1 n ( x X ¯ ) 2 n 1

年代的平方根是无偏估计量的方差的人口X是画,只要X由独立、恒等分布的样本。 X ¯ 是样本均值。

注意,在这个方差公式分母n- 1。

总体标准偏差

如果数据是整个人口的值,那么你可以使用总体标准偏差,

σ = = 1 n ( x μ ) 2 n

如果X是一个随机样本的人口,那么意味着什么μ是样本均值估计的,σ是有偏见的极大似然估计量的总体标准偏差。

注意,在这个方差公式分母n

算法

zscore返回对于任何示例包含年代。

zscore返回0对于任何样本,是常数(所有的值都是一样的)。例如,如果X是一个向量相同的数值,然后呢Z是一个向量的0年代。

扩展功能

版本历史

之前介绍过的R2006a