主要内容

ksdensity

内核平滑函数估计为单变量和二元数据

描述

例子

(f,)= ksdensity (x)返回一个概率密度估计,f样本数据的向量或两列矩阵x。估计是基于正常的内核函数,和评估在条平行的点,覆盖范围的数据xksdensity估计单变量数据的密度在100点,或900分二元数据。

ksdensity最好是连续分布样本。

例子

(f,)= ksdensity (x,)指定点()来评估f。在这里,包含相同的值。

例子

(f,)= ksdensity (___,名称,值)使用附加选项指定一个或多个名称-值对参数除了任何输入参数在前面的语法。例如,您可以定义函数类型ksdensity累积概率评估,如概率密度,幸存者函数,等等。或者你可以指定带宽的平滑窗口。

例子

(f,,bw)= ksdensity (___)还返回内核的带宽平滑窗口,bw。默认的带宽是正常的最佳密度。

例子

ksdensity (___)情节内核平滑函数估计。

ksdensity (斧头,___)土地使用轴与处理结果,斧头,而不是返回当前轴gca

例子

全部折叠

生成一个样本数据集的两个正态分布的混合物。

rng (“默认”)%的再现性1 x = [randn(30日);5 + randn(30日1)];

情节估计的密度。

[f, xi] = ksdensity (x);图绘制(xi, f);

图包含一个坐标轴对象。坐标轴对象包含一个类型的对象。

样品的密度估计显示双峰性。

从half-normal生成非负样本数据集分布。

rng (“默认”)%的再现性pd = makedist (“HalfNormal”,“亩”0,“σ”1);x =随机(pd, 100, (1);

估计pdf与两种不同的边界修正方法,对数转换和反思,通过使用“BoundaryCorrection”名称-值对的论点。

分= linspace (0, 1000);%点评价估计量[f1,ξ1]= ksdensity (x,分,“万博1manbetx支持”,“积极”);(f2,ξ2))= ksdensity (x,分,“万博1manbetx支持”,“积极”,“BoundaryCorrection”,“反射”);

画出两个估计的pdf文件。

f1情节(ξ1,ξ2,f2)乐金显示器=传奇(“日志”,“反射”);标题(乐金显示器,“边界修正法”)xl = xlim;xlim ([-0.25 xl xl (1) (2)))

图包含一个坐标轴对象。坐标轴对象包含2线类型的对象。这些对象代表日志,反射。

ksdensity使用边界修正方法当你指定或正面或有界的支持。万博1manbetx默认的日志转换边界修正方法。当ksdensity转换的支持,它介绍了万博1manbetx1 / x术语的核密度估计量。因此,估计有一个峰值附近x = 0。另一方面,反射法不会引起不良的山峰在边界附近。

加载示例数据。

负载医院

计算和情节估计cdf评估在指定的一组值。

分= (min (hospital.Weight): 2:马克斯(hospital.Weight));图()ecdf (hospital.Weight)(f, xi, bw) = ksdensity (hospital.Weight、分“万博1manbetx支持”,“积极”,“函数”,“提供”);情节(xi, f,“g”,“线宽”2)传说(“经验提供”,“kernel-bw:违约”,“位置”,“西北”)包含(“病人体重”)ylabel (“估计提供”)

图包含一个坐标轴对象。坐标轴对象包含2楼梯,类型的对象。这些对象代表经验提供kernel-bw:违约。

ksdensity似乎光滑的累积分布函数估计太多。估计有一个较小的带宽可能会产生一个经验累积分布函数的估算。

返回的带宽平滑窗口。

bw
bw = 0.1070

情节累积分布函数的估计使用一个较小的带宽。

[f, xi] = ksdensity (hospital.Weight、分“万博1manbetx支持”,“积极”,“函数”,“提供”,“带宽”,0.05);情节(xi, f,“——r”,“线宽”2)传说(“经验提供”,“kernel-bw:违约”,“kernel-bw: 0.05”,“位置”,“西北”)举行

图包含一个坐标轴对象。坐标轴对象包含3楼梯,类型的对象。这些对象代表经验提供kernel-bw:默认情况下,kernel-bw: 0.05。

ksdensity估计小带宽匹配经验累积分布函数更好。

加载示例数据。

负载医院

情节估计cdf评估在50岁等距的点。

图()ksdensity (hospital.Weight,“万博1manbetx支持”,“积极”,“函数”,“提供”,“NumPoints”,50)包含(“病人体重”)ylabel (“估计提供”)

图包含一个坐标轴对象。坐标轴对象包含一个类型的对象。

生成样本数据的指数分布与平均3。

rng (“默认”)%的再现性随机(x =“经验”,3100,(1);

创建一个逻辑向量表示审查。在这里,观察与寿命超过10审查。

T = 10;岑= (x > T);

计算和绘制估计密度函数。

图ksdensity (x,“万博1manbetx支持”,“积极”,“审查”岑);

图包含一个坐标轴对象。坐标轴对象包含一个类型的对象。

函数计算和绘制的幸存者。

图ksdensity (x,“万博1manbetx支持”,“积极”,“审查”岑,“函数”,“幸存者”);

图包含一个坐标轴对象。坐标轴对象包含一个类型的对象。

计算和绘制累积风险函数。

图ksdensity (x,“万博1manbetx支持”,“积极”,“审查”岑,“函数”,“cumhazard”);

图包含一个坐标轴对象。坐标轴对象包含一个类型的对象。

生成两个正态分布的混合物,和情节估计逆累积分布函数在指定的概率值。

rng (“默认”)%的再现性1 x = [randn(30日);5 + randn(30日1)];π= linspace (0 . 01, 99);图ksdensity (x,π,“函数”,“icdf”);

图包含一个坐标轴对象。坐标轴对象包含一个类型的对象。

生成两个正态分布的混合物。

rng (“默认”)%的再现性1 x = [randn(30日);5 + randn(30日1)];

返回的带宽平滑窗口概率密度估计。

(f, xi, bw) = ksdensity (x);bw
bw = 1.5141

默认的带宽对正常密度是最优的。

情节估计的密度。

图绘制(xi, f);包含(“十一”)ylabel (“f”)举行

图包含一个坐标轴对象。坐标轴对象包含一个类型的对象。

情节密度使用增加的带宽值。

[f, xi] = ksdensity (x,“带宽”,1.8);情节(xi, f,“——r”,“线宽”,1.5)

图包含一个坐标轴对象。坐标轴对象包含2线类型的对象。

更高的带宽进一步抚平密度估计,这可能会掩盖一些分布的特征。

现在,情节密度使用减少带宽值。

[f, xi] = ksdensity (x,“带宽”,0.8);情节(xi, f,“同意”,“线宽”传说,1.5)(“bw =违约”,“bw = 1.8”,“bw = 0.8”)举行

图包含一个坐标轴对象。坐标轴对象包含3线类型的对象。这些对象代表bw =违约,bw = 1.8, bw = 0.8。

较小的带宽平滑密度估计少,夸大了一些样本的特征。

创建一个两列向量的点密度的评价。

gridx1 = -0.25: .05:1.25;gridx2 = 0: .1:15;(x1, x2) = meshgrid (gridx1 gridx2);x1 = x1 (:);x2 = x2 (:);ξ= (x1, x2));

生成一个30-by-2矩阵包含二元正态分布的随机数从混合物中。

rng (“默认”)%的再现性x =[0兰德(20日1)+ 5 * 5 + 2.5 *兰德(20日1);综合成绩+ .25 *兰德(10,1)8.75 + 1.25 *兰德(10,1)];

情节的估计密度示例数据。

图ksdensity (x, xi);

图包含一个坐标轴对象。坐标轴对象包含一个类型的对象的表面。

输入参数

全部折叠

样本数据的ksdensity返回f值,指定为一个列向量或两列矩阵。对单变量数据使用一个列向量,一个两列二维数据矩阵。

例子:[f, xi] = ksdensity (x)

数据类型:|

点评估f指定为一个向量或两列矩阵。对于单变量数据,可以是一行或列向量。返回的输出的长度f等于点的数量

例子:分= (0:1:25);ksdensity (x,分);

数据类型:|

轴图处理ksdensity情节,指定为一个句柄。

例如,如果h是一个图的处理呢ksdensity可以画出图,如下所示。

例子:ksdensity (h, x)

名称-值参数

指定可选的双参数作为Name1 = Value1,…,以=家,在那里的名字参数名称和吗价值相应的价值。名称-值参数必须出现在其他参数,但对的顺序无关紧要。

R2021a之前,用逗号来分隔每一个名称和值,并附上的名字在报价。

例子:“审查”,岑,“内核”、“三角形”,“NumPoints”, 20岁的“函数”,“提供”指定ksdensity估计,它强调通过评估20等距的点覆盖范围的数据,使用三角形内核审查数据的平滑函数和会计信息向量

kernel-smoothing窗口的带宽,这是一个功能点的数量x,指定为逗号分隔两人组成的“带宽”和一个标量值。如果样品数据是二元的,带宽也可以是双元素向量。默认是最优估计正常密度[1],但是你可能想要选择一个更大或更小的值平滑或多或少。

如果您指定“BoundaryCorrection”作为“日志”(默认),“万博1manbetx支持”作为“积极”或一个向量(L U),ksdensity将有界无界使用对数转换数据。的价值“带宽”在转换后的值的规模。

例子:“带宽”,0.8

数据类型:|

边界修正方法,指定为逗号分隔组成的“BoundaryCorrection”“日志”“反射”

价值 描述
“日志”

ksdensity转换的数据x被一个无限的转换。然后,它将回到原来的有界规模后密度估计。

  • 对于单变量数据,如果你指定“万博1manbetx支持”,“积极”,然后ksdensity适用于日志(x)

  • 对于单变量数据,如果你指定“万博1manbetx支持”,[L U],在那里lU是数字标量和L < U,然后ksdensity适用于日志((xl) / (U-x))

  • 对于二元数据,ksdensity将每一列的x以同样的方式与单变量数据。

的价值“带宽”bw输出的转换后的值。

“反射”

ksdensity增加有限的数据通过添加反射边界附近的数据,然后它返回估计对应于原始的支持。万博1manbetx有关详细信息,请参见反射法

ksdensity只有当你指定适用边界修正“万博1manbetx支持”除了作为一个值“无限”

例子:“BoundaryCorrection”、“反射”

逻辑向量表示审查哪些条目,指定为逗号分隔组成的“审查”和一个向量二进制值。值0表示没有审查,1表明,观察是审查。默认是没有审查。这个名称-值对只适用于单变量数据。

例子:“审查”,censdata

数据类型:逻辑

函数来估计,指定为逗号分隔组成的“函数”和一个以下。

价值 描述
“pdf” 概率密度函数。
“提供” 累积分布函数。
“icdf”

逆累积分布函数。ksdensity计算估计逆cdf的价值观x在指定的概率值,评估它π

这个值是有效的只有一元数据。

“幸存者” 幸存者的功能。
“cumhazard”

累积风险函数。

这个值是有效的只有一元数据。

例子:“函数”,“icdf”

类型的内核平滑,指定为逗号分隔组成的“内核”和一个以下。

  • “正常”(默认)

  • “盒子”

  • “三角形”

  • “epanechnikov”

  • 一个内核函数,是一个自定义或内置函数。指定函数作为函数处理(例如,@myfunction@normpdf)或作为特征向量或字符串标量(例如,“myfunction”“normpdf”)。软件调用指定的函数有一个参数是一个数组的数据值之间的距离和位置的密度是评价。同样大小的函数必须返回一个数组包含相应的内核函数的值。

    “函数”“pdf”密度,内核函数返回值。否则,它将返回累积概率值。

    指定一个自定义内核时“函数”“icdf”返回一个错误。

对于二元数据,ksdensity同样的内核适用于每个维度。

例子:“内核”、“盒子”

等距的点的数量,指定为逗号分隔两人组成的“NumPoints”和一个标量值。这个名称-值对只适用于单变量数据。

例如,对于一个内核指定函数的光滑估计在80等距的点样本数据的范围内,输入:

例子:“NumPoints”, 80年

数据类型:|

万博1manbetx支持密度,指定为逗号分隔组成的“万博1manbetx支持”和一个以下。

价值 描述
“无限” 违约。允许密度扩展在整个实线。
“积极” 将密度限制在积极的价值观。
双元素向量,(L U) 给有限的上下边界密度的支持。万博1manbetx此选项只适用于单变量示例数据。
2乘2矩阵,(L1 L2;U1 U2) 给有限的上下边界密度的支持。万博1manbetx第一行包含下限和第二行包含了上限。此选项只适用于二元示例数据。

对于二元数据,“万博1manbetx支持”可以积极的、无限的,或有界变量指定为[0负无穷;正正)[0 L;正你)

例子:“万博1manbetx支持”,“积极”

例子:“万博1manbetx支持”,[0 10]

数据类型:||字符|字符串

函数用于创建内核密度图,指定为逗号分隔组成的“PlotFcn”和一个以下。

价值 描述
“冲浪” 三维阴影曲面图,使用创建的冲浪
“轮廓” 等高线图,使用创建的轮廓
“plot3” 三维线情节,使用创建的plot3
“surfc” 等高线图三维阴影曲面图,使用创建的surfc

这个名称-值对只是二元样本数据有效。

例子:“PlotFcn”、“轮廓”

权重为样本数据,指定为逗号分隔组成的“重量”和一个向量的长度大小(x, 1),在那里x示例数据。

例子:“重量”,xw

数据类型:|

输出参数

全部折叠

估计函数值,作为一个向量的长度等于返回点的数量

评估点的ksdensity计算f,作为一个向量或返回一个两列矩阵。对于单变量数据,默认是100条平行的点覆盖范围的数据x。对于二元数据,默认是900条平行的点创建使用meshgrid在每个维度从30条平行的点。

带宽的平滑窗口,作为一个标量值返回。

如果您指定“BoundaryCorrection”作为“日志”(默认),“万博1manbetx支持”作为“积极”或一个向量(L U),ksdensity将有界无界使用对数转换数据。的价值bw在转换后的值的规模。

更多关于

全部折叠

内核分配

一个内核分布的非参数表示随机变量的概率密度函数(pdf)。您可以使用一个内核分布参数时不能正确描述数据,或者当你想避免对数据的分布进行假设。内核分布定义为一个平滑函数和一个带宽值,控制产生的密度曲线的平滑度。

核密度估计量是一个随机变量的估计pdf。对于任何真正的价值x核密度估计的公式是由

f ^ h ( x ) = 1 n h = 1 n K ( x x h ) ,

在哪里x1,x2、…xn从一个未知的随机抽样分布,n是样品的尺寸, K ( · ) 是内核平滑函数,h是带宽。

累积分布函数的核估计量(cdf),对于任何真正的价值x的话,是

F ^ h ( x ) = x f ^ h ( t ) d t = 1 n = 1 n G ( x x h ) ,

在哪里 G ( x ) = x K ( t ) d t

更多细节,请参阅内核分配

反射法

反射法是一个边界修正法,准确地发现核密度估计当随机变量有界的支持。万博1manbetx如果您指定“BoundaryCorrection”、“反射”,ksdensity使用反射法。这种方法增加有限的数据通过添加反映数据在边界附近,并估计pdf。然后,ksdensity返回估计pdf对应于原始支持通过适当的归一化,这样估计pdf的积分等于1最初的支持。万博1manbetx

如果您另外指定“万博1manbetx支持”,[L U],然后ksdensity发现内核估计如下。

  • 如果“函数”“pdf”,核密度估计

    f ^ h ( x ) = 1 n h = 1 n ( K ( x x h ) + K ( x x h ) + K ( x x + h ) ] lxU,

    在哪里 x = 2 l x , x + = 2 U x ,x示例数据。

  • 如果“函数”“提供”,那么内核对cdf实验组的估计量

    F ^ h ( x ) = 1 n = 1 n ( G ( x x h ) + G ( x x h ) + G ( x x + h ) ] 1 n = 1 n ( G ( l x h ) + G ( l x h ) + G ( l x + h ) ] lxU

  • 获得一个内核逆cdf实验组的估计,一个幸存者函数,或累积风险函数(当“函数”“icdf”,“幸存者”,或“cumhazrd”),ksdensity使用两种 f ^ h ( x ) F ^ h ( x )

如果您另外指定“万博1manbetx支持”作为“积极”[0正],然后ksdensity发现内核估计值代替(L U)[0正]在上面的方程。

引用

[1]鲍曼,a·W。,A. Azzalini.应用平滑技术进行数据分析。纽约:牛津大学出版社有限公司,1997年。

[2],p·d·“内核分布函数的估计。”通信在统计理论和方法。问题。3卷14日,1985年,页605 - 620。

琼斯[3],m . c .“简单边界修正核密度估计。”统计和计算。3卷,第三期,1993年,页135 - 146。

[4]西尔弗曼,b . W。密度估计的统计和数据分析。查普曼&大厅/ CRC, 1986。

扩展功能

版本历史

之前介绍过的R2006a