泰姬陵

Mahalanobis距离

描述

例子

d2=泰姬陵(YX返回的平方Mahalanobis距离每一个观察结果Y参考样品在X

例子

全部折叠

生成相关的二元样本数据集。

rng (“默认”%的再现性X = mvnrnd([0;0],[1.9;;9 1], 1000);

指定四个离平均值等距的观测值X在欧氏距离。

Y = [1 1;1 1;-1 1];

计算每个观测点的马氏距离Y参考样品在X

d2_mahal =泰姬陵(Y, X)
d2_mahal =4×11.1095 20.3632 19.5939 1.0137

计算每个观测点的欧氏距离的平方Y从平均数X

d2_Euclidean =总和((Y-mean (X)) ^ 2, 2)
d2_Euclidean =4×12.0931 2.0399 1.9625 1.9094

情节XY通过使用散射并使用标记色来可视化马氏距离Y参考样品在X

散射(X (: 1) X(:, 2), 10日“。”%散点图的大小为10持有散射(Y (: 1), Y(:, 2), 100年,d2_mahal,“o”“填充”) hb = colorbar;ylabel (hb,“Mahalanobis距离”)传说(“X”“Y”“位置”“最佳”

所有的观察Y[1][1][1],[1])距离的平均值相等X在欧氏距离。然而,[1][1]比?更接近X[1][1]在距离。由于马氏距离考虑了数据的协方差和不同变量的规模,它是有用的异常值检测。

输入参数

全部折叠

指定为n——- - - - - -数字矩阵,n观察的次数是多少是每次观察中的变量数。

XY必须有相同的列数,但可以有不同的行数。

数据类型:|

参考样品,指定为p——- - - - - -数字矩阵,p样品的数量是多少是每个样本中的变量数。

XY必须有相同的列数,但可以有不同的行数。X行数必须多于列数。

数据类型:|

输出参数

全部折叠

的平方Mahalanobis距离每一个观察结果Y参考样品在X,返回为n-乘1的数字向量,其中n观察的次数是多少X

更多关于

全部折叠

Mahalanobis距离

马氏距离是一个样本点和一个分布之间的度量。

马氏距离是一个矢量y一个有均值的分布μ和协方差Σ

d y μ 1 y μ

这个距离表示多远y离均值有多少个标准差。

泰姬陵返回马氏距离的平方d2通过观察Y参考样品在X.在泰姬陵函数,μΣ分别为参考样本的样本均值和协方差。

另请参阅

|

之前介绍过的R2006a