主要内容

ksdensity

单变量和二元数据的核平滑函数估计

描述

例子

f西= ksdensity(x返回概率密度估计值,f,表示向量或两列矩阵中的样本数据x.估计是基于一个正常的核函数,并在等间距的点上进行评估,西的数据范围xksdensity对单变量数据估计密度为100点,对双变量数据估计密度为900点。

ksdensity最适合连续分布的样本。

例子

f西= ksdensity(x指定点()来评估f.在这里,西而且包含相同的值。

例子

f西= ksdensity(___名称,值除前面语法中的任何输入参数外,使用由一个或多个名-值对参数指定的其他选项。例如,可以定义函数类型ksdensity计算,如概率密度、累积概率、幸存者函数等。或者你可以指定平滑窗口的带宽。

例子

f西bw= ksdensity(___还返回核平滑窗口的带宽,bw.默认带宽是正常密度的最佳带宽。

例子

ksdensity (___绘制核平滑函数估计。

ksdensity (斧头___使用带有句柄的轴绘制结果,斧头,而不是返回的当前轴gca

例子

全部折叠

从两个正态分布的混合物中生成一个样本数据集。

rng (“默认”%用于再现性X = [randn(30,1);5 + randn(30日1)];

画出估计的密度。

[f,xi] = ksdensity(x);图绘制(xi, f);

图中包含一个轴对象。axis对象包含一个line类型的对象。

密度估计显示了样品的双峰性。

从半正态分布生成一个非负样本数据集。

rng (“默认”%用于再现性Pd = makedist(“HalfNormal”“亩”0,“σ”1);X = random(pd,100,1);

用两种不同的边界修正方法,对数变换和反射来估计pdf“BoundaryCorrection”名称-值对参数。

PTS = linspace(0,5,1000);%的点来评估估计器[f1,xi1] = ksdensity(x,pts,“万博1manbetx支持”“积极”);[f2,xi2] = ksdensity(x,pts,“万博1manbetx支持”“积极”“BoundaryCorrection”“反射”);

绘制两个估计的pdf文件。

Plot (xi1,f1,xi2,f2) LGD = legend(“日志”“反射”);标题(乐金显示器,“边界修正法”) xl = xlim;xlim ([-0.25 xl xl (1) (2)))

图中包含一个轴对象。axis对象包含2个line类型的对象。这些对象代表日志、反射。

ksdensity当指定正支持或有界支持时,使用边界修正方法。万博1manbetx默认的边界修正方法是对数变换。当ksdensity将支持转换回来,它引入万博1manbetx1 / x核密度估计中的项。因此,估计有一个峰值附近X = 0.另一方面,反射法不会在边界附近产生不理想的峰。

加载样例数据。

负载医院

计算并绘制在指定值集上计算的估计cdf。

pts = (min(hospital.Weight):2:max(hospital.Weight));图()ecdf(医院。重量)等待[f,xi,bw] = ksdensity(医院。体重、分“万博1manbetx支持”“积极”...“函数”“提供”);情节(xi, f,“g”“线宽”2)传说(“经验提供”“kernel-bw:违约”“位置”“西北”)包含(“病人体重”) ylabel (“估计提供”

图中包含一个轴对象。坐标轴对象包含楼梯、直线类型的2个对象。这些对象表示经验cdf, kernel-bw:default。

ksdensity似乎平滑累积分布函数估计太多。较小带宽的估计可能产生更接近经验累积分布函数的估计。

返回平滑窗口的带宽。

bw
Bw = 0.1070

用较小的带宽绘制累计分布函数估计值。

[f,xi] = ksdensity(医院。体重、分“万博1manbetx支持”“积极”...“函数”“提供”“带宽”, 0.05);情节(xi, f,“——r”“线宽”2)传说(“经验提供”“kernel-bw:违约”“kernel-bw: 0.05”...“位置”“西北”)举行

图中包含一个轴对象。坐标轴对象包含三个楼梯、直线类型的对象。这些对象表示经验cdf, kernel-bw:default, kernel-bw:0.05。

ksdensity带宽越小的估计越符合经验累积分布函数。

加载样例数据。

负载医院

在50个等距点处绘制估计的cdf。

图()ksdensity(医院。重量,“万博1manbetx支持”“积极”“函数”“提供”...“NumPoints”, 50)包含(“病人体重”) ylabel (“估计提供”

图中包含一个轴对象。axis对象包含一个line类型的对象。

从均值为3的指数分布生成样本数据。

rng (“默认”%用于再现性X =随机的(“经验”, 3100, (1);

创建一个表示审查的逻辑向量。在这里,寿命超过10年的观测结果被审查。

T = 10;cens = (x>T);

计算并绘制估计密度函数。

图ksdensity (x,“万博1manbetx支持”“积极”“审查”岑);

图中包含一个轴对象。axis对象包含一个line类型的对象。

计算并绘制幸存者函数。

图ksdensity (x,“万博1manbetx支持”“积极”“审查”岑,...“函数”“幸存者”);

图中包含一个轴对象。axis对象包含一个line类型的对象。

计算并绘制累积危险函数。

图ksdensity (x,“万博1manbetx支持”“积极”“审查”岑,...“函数”“cumhazard”);

图中包含一个轴对象。axis对象包含一个line类型的对象。

生成两个正态分布的混合物,并在指定的概率值集上绘制估计的逆累积分布函数。

rng (“默认”%用于再现性X = [randn(30,1);5 + randn(30日1)];PI = linspace(.01,.99,99);图ksdensity (x,π,“函数”“icdf”);

图中包含一个轴对象。axis对象包含一个line类型的对象。

生成两个正态分布的混合。

rng (“默认”%用于再现性X = [randn(30,1);5 + randn(30日1)];

返回用于概率密度估计的平滑窗口带宽。

[f,xi,bw] = ksdensity(x);bw
Bw = 1.5141

默认带宽对于正常密度是最优的。

画出估计的密度。

图绘制(xi, f);包含(“十一”) ylabel (“f”)举行

图中包含一个轴对象。axis对象包含一个line类型的对象。

使用增加的带宽值绘制密度。

[f,xi] = ksdensity(x,“带宽”, 1.8);情节(xi, f,“——r”“线宽”, 1.5)

图中包含一个轴对象。axis对象包含2个line类型的对象。

更高的带宽进一步平滑密度估计,这可能会掩盖分布的一些特征。

现在,用减小的带宽值绘制密度。

[f,xi] = ksdensity(x,“带宽”, 0.8);情节(xi, f,“同意”“线宽”传说,1.5)('bw = default''bw = 1.8''bw = 0.8')举行

图中包含一个轴对象。axis对象包含3个line类型的对象。这些对象表示bw = default, bw = 1.8, bw = 0.8。

较小的带宽使密度估计更平滑,这夸大了样本的某些特征。

创建一个由点组成的两列向量来评估密度。

Gridx1 = -0.25:.05:1.25;Gridx2 = 0:.1:15;[x1,x2] = meshgrid(gridx1, gridx2);X1 = X1 (:);X2 = X2 (:);

从二元正态分布的混合物中生成一个包含随机数的30 × 2矩阵。

rng (“默认”%用于再现性X = [0+.5*rand(20,1) 5+2.5*rand(20,1);综合成绩+ .25 *兰德(10,1)8.75 + 1.25 *兰德(10,1)];

绘制样本数据的估计密度。

图ksdensity (x, xi);

图中包含一个轴对象。axis对象包含一个surface类型的对象。

输入参数

全部折叠

其中的示例数据ksdensity返回f值,指定为列向量或两列矩阵。对于单变量数据使用列向量,对于双变量数据使用两列矩阵。

例子:[f,xi] = ksdensity(x)

数据类型:|

要计算的点f,指定为向量或两列矩阵。对于单变量数据,可以是行向量或列向量。返回输出的长度f等于里面的点数

例子:PTS = (0:1:25);ksdensity (x,分);

数据类型:|

图形的轴句柄ksdensity绘制到,指定为句柄。

例如,如果h那是一个数字的柄吗ksdensity可以画出这样的图形。

例子:ksdensity (h, x)

名称-值参数

的可选逗号分隔对名称,值参数。的名字参数名称和价值对应的值。的名字必须出现在引号内。您可以以任意顺序指定多个名称和值对参数Name1, Value1,…,的家

例子:“审查”,岑,“内核”、“三角形”,“NumPoints”,20岁的“函数”,“提供”指定ksdensity通过在覆盖数据范围的20个等间隔点上评估CDF,使用三角核平滑函数并考虑向量中的删减数据信息

核平滑窗口的带宽,这是一个函数的点的数量x,指定为逗号分隔的对,由“带宽”和一个标量值。如果样本数据是二元的,带宽也可以是二元向量。默认值是估计正常密度的最佳值[1],但你可能想要选择一个更大或更小的值来平滑或多或少。

如果你指定“BoundaryCorrection”作为“日志”(默认),“万博1manbetx支持”作为“积极”或者向量(L U)ksdensity使用日志转换将有界数据转换为无界数据。的价值“带宽”在变换后的值的尺度上。

例子:“带宽”,0.8

数据类型:|

边界修正方法,指定为由逗号分隔的对组成“BoundaryCorrection”而且“日志”“反射”

价值 描述
“日志”

ksdensity转换有界数据x不受下列转换之一的限制。然后,经过密度估计后,变换回原来的有界尺度。

  • 对于单变量数据,如果指定“万博1manbetx支持”,“积极”,然后ksdensity适用于日志(x)

  • 对于单变量数据,如果指定“万博1manbetx支持”,[L U],在那里l而且U数字标量和L < u,然后ksdensity适用于日志((xl) / (U-x))

  • 对于二元数据,ksdensity变换的每一列x单变量数据也是如此。

的价值“带宽”bw输出以转换后的值为尺度。

“反射”

ksdensity通过在边界附近添加反射数据来增强有界数据,然后返回与原始支持相对应的估计值。万博1manbetx详细信息请参见反射法

ksdensity仅在指定时应用边界校正“万博1manbetx支持”作为一种价值“无限”

例子:“BoundaryCorrection”、“反射”

表示哪些条目被删除的逻辑向量,指定为逗号分隔的对,由“审查”和一个二进制值的向量。值为0表示没有审查,值为1表示观察结果被审查。默认情况是没有审查。此名称-值对仅对单变量数据有效。

例子:“审查”,censdata

数据类型:逻辑

函数要估计,指定为逗号分隔的对,由“函数”下面是其中之一。

价值 描述
“pdf” 概率密度函数。
“提供” 累积分布函数。
“icdf”

逆累积分布函数。ksdensity计算中值的估计逆CDFx,并按中指定的概率值计算π

该值仅对单变量数据有效。

“幸存者” 幸存者的功能。
“cumhazard”

累积危险函数。

该值仅对单变量数据有效。

例子:“函数”“icdf”

内核平滑器的类型,指定为逗号分隔的对,由“内核”下面是其中之一。

  • “正常”(默认)

  • “盒子”

  • “三角形”

  • “epanechnikov”

  • 一种自定义或内置函数的内核函数。将函数指定为函数句柄(例如,@myfunction@normpdf)或作为字符向量或字符串标量(例如,“myfunction”“normpdf”).该软件使用一个参数调用指定的函数,该参数是数据值和计算密度的位置之间的距离数组。该函数必须返回一个相同大小的数组,其中包含核函数的相应值。

    “函数”“pdf”时,核函数返回密度值。否则,它返回累积概率值。

    指定自定义内核时“函数”“icdf”返回一个错误。

对于二元数据,ksdensity对每个维度应用相同的内核。

例子:“内核”、“盒子”

中等距点的数目西,指定为逗号分隔的对,由“NumPoints”和一个标量值。此名称-值对仅对单变量数据有效。

例如,对于指定函数在样本数据范围内80个等间隔点上的核平滑估计,输入:

例子:“NumPoints”,80年

数据类型:|

万博1manbetx支持的密度,指定为由逗号分隔的对组成“万博1manbetx支持”下面是其中之一。

价值 描述
“无限” 违约。允许密度扩展到整个实线。
“积极” 将密度限制为正值。
双元素向量,(L U) 给出密度支持的有限下界和上界。万博1manbetx此选项仅对单变量样本数据有效。
2乘2矩阵,(L1 L2;U1 U2) 给出密度支持的有限下界和上界。万博1manbetx第一行包含下限,第二行包含上限。此选项仅对二元样本数据有效。

对于二元数据,“万博1manbetx支持”可以是正数、无界或有界变量的组合,指定为[0负无穷;正正)[0 L;正你)

例子:“万博1manbetx支持”,“积极”

例子:“万博1manbetx支持”,[0 10]

数据类型:||字符|字符串

函数用于创建内核密度图,指定为逗号分隔的对,由“PlotFcn”下面是其中之一。

价值 描述
“冲浪” 三维阴影表面图,创建使用冲浪
“轮廓” 等高线图,创建使用轮廓
“plot3” 3-D线图,创建使用plot3
“surfc” 三维阴影表面下的等高线图,使用surfc

此名值对仅对二元样本数据有效。

例子:“PlotFcn”、“轮廓”

样例数据的权重,指定为逗号分隔的对,由“重量”和一个长度向量大小(x, 1),在那里x是示例数据。

例子:“重量”,xw

数据类型:|

输出参数

全部折叠

估计的函数值,返回为一个向量,其长度等于在西

评估点ksdensity计算f,以向量或两列矩阵的形式返回。对于单变量数据,默认是100个等间距的点,涵盖的数据范围x.对于二元数据,默认是900个等间距点meshgrid从每个维度的30个等距点开始。

平滑窗口的带宽,作为标量值返回。

如果你指定“BoundaryCorrection”作为“日志”(默认),“万博1manbetx支持”作为“积极”或者向量(L U)ksdensity使用日志转换将有界数据转换为无界数据。的价值bw在变换后的值的尺度上。

更多关于

全部折叠

内核分配

核分布是随机变量的概率密度函数(pdf)的非参数表示。当参数分布不能正确描述数据时,或者当您希望避免对数据的分布进行假设时,可以使用内核分布。核分布由平滑函数和带宽值定义,带宽值控制得到的密度曲线的平滑度。

核密度估计器是一个随机变量的估计pdf。的任何实值x时,核密度估计器的公式为

f h x 1 n h 1 n K x x h

在哪里x1x2、……xn是来自未知分布的随机样本,n是样本容量, K · 是核平滑函数,和h是带宽。

的任何实值,累积分布函数(cdf)的核估计器x,由

F h x x f h t d t 1 n 1 n G x x h

在哪里 G x x K t d t

详情请参见内核分配

反射法

反射法是一种边界修正方法,当随机变量具有有界支持时,它能准确地找到核密度估计量。万博1manbetx如果你指定“BoundaryCorrection”、“反射”ksdensity使用反射方法。该方法通过添加边界附近的反射数据来增强有界数据,并估计pdf。然后,ksdensity通过适当的归一化返回与原始支持度相对应的估计PDF,以便估计PDF对原始支持度的积分等于1。万博1manbetx

如果你另外指定“万博1manbetx支持”,[L U],然后ksdensity如下所示查找核估计器。

  • 如果“函数”“pdf”,则核密度估计量为

    f h x 1 n h 1 n K x x h + K x x h + K x x + h lxU

    在哪里 x 2 l x x + 2 U x ,x样本数据。

  • 如果“函数”“提供”,则CDF的核估计量为

    F h x 1 n 1 n G x x h + G x x h + G x x + h 1 n 1 n G l x h + G l x h + G l x + h lxU

  • 为了获得逆cdf、幸存者函数或累积危险函数的核估计量(当“函数”“icdf”“幸存者”,或“cumhazrd”),ksdensity使用两种 f h x 而且 F h x

如果你另外指定“万博1manbetx支持”作为“积极”[0正],然后ksdensity通过替换找到核估计器(L U)[0正]在上面的方程中。

参考文献

[1]鲍曼,a.w.和A.阿扎里尼。平滑技术在数据分析中的应用.纽约:牛津大学出版社,1997年。

[2] Hill, P. D. <分布函数的核估计>。统计通讯-理论与方法“,.第14卷,1985年第3期,第605-620页。

[3] Jones, m.c.“核密度估计的简单边界修正”。统计与计算.第3卷,1993年第3期,第135-146页。

[4]西尔弗曼,b.w.。用于统计和数据分析的密度估计.查普曼和霍尔/CRC, 1986年。

扩展功能

R2006a之前介绍