ksdensity

内核平滑函数估计为单变量和二元数据

所有的页面崩溃

语法

[f, xi] = ksdensity (x)

[f, xi] = ksdensity (x,分)

[f, xi] = ksdensity (___、名称、值)

(f, xi, bw) = ksdensity (___)

ksdensity (___)

ksdensity (ax,___)

描述

例子

(f,习)= ksdensity (x)返回一个概率密度估计,f样本数据的向量或两列矩阵x。估计是基于正常的内核函数,和评估在条平行的点,习覆盖范围的数据x。ksdensity估计单变量数据的密度在100点,或900分二元数据。

ksdensity最好是连续分布样本。

例子

(f,习)= ksdensity (x,分)指定点(分)来评估f。在这里,习和分包含相同的值。

例子

(f,习)= ksdensity (___,名称,值)使用附加选项指定一个或多个名称-值对参数除了任何输入参数在前面的语法。例如,您可以定义函数类型ksdensity累积概率评估,如概率密度,幸存者函数,等等。或者你可以指定带宽的平滑窗口。

例子

(f,习,bw)= ksdensity (___)还返回内核的带宽平滑窗口,bw。默认的带宽是正常的最佳密度。

例子

ksdensity (___)情节内核平滑函数估计。

ksdensity (斧头,___)土地使用轴与处理结果,斧头,而不是返回当前轴gca。

例子

全部折叠

估计密度

打开生活的脚本

生成一个样本数据集的两个正态分布的混合物。

rng (“默认”)%的再现性1 x = [randn(30日);5 + randn(30日1)];

情节估计的密度。

[f, xi] = ksdensity (x);图绘制(xi, f);

图包含一个坐标轴对象。坐标轴对象包含一个类型的对象。

样品的密度估计显示双峰性。

估计与边界密度修正

打开生活的脚本

从half-normal生成非负样本数据集分布。

rng (“默认”)%的再现性pd = makedist (“HalfNormal”,“亩”0,“σ”1);x =随机(pd, 100, (1);

估计pdf与两种不同的边界修正方法,对数转换和反思,通过使用“BoundaryCorrection”名称-值对的论点。

分= linspace (0, 1000);%点评价估计量[f1,ξ1]= ksdensity (x,分,“万博1manbetx支持”,“积极”);(f2,ξ2))= ksdensity (x,分,“万博1manbetx支持”,“积极”,“BoundaryCorrection”,“反射”);

画出两个估计的pdf文件。

f1情节(ξ1,ξ2,f2)乐金显示器=传奇(“日志”,“反射”);标题(乐金显示器,“边界修正法”)xl = xlim;xlim ([-0.25 xl xl (1) (2)))

图包含一个坐标轴对象。坐标轴对象包含2线类型的对象。这些对象代表日志,反射。

ksdensity使用边界修正方法当你指定或正面或有界的支持。万博1manbetx默认的日志转换边界修正方法。当ksdensity转换的支持,它介绍了万博1manbetx1 / x术语的核密度估计量。因此,估计有一个峰值附近x = 0。另一方面,反射法不会引起不良的山峰在边界附近。

估计累积分布函数在指定值

打开生活的脚本

加载示例数据。

负载医院

计算和情节估计cdf评估在指定的一组值。

分= (min (hospital.Weight): 2:马克斯(hospital.Weight));图()ecdf (hospital.Weight)在(f, xi, bw) = ksdensity (hospital.Weight、分“万博1manbetx支持”,“积极”,…“函数”,“提供”);情节(xi, f,“g”,“线宽”2)传说(“经验提供”,“kernel-bw:违约”,“位置”,“西北”)包含(“病人体重”)ylabel (“估计提供”)

图包含一个坐标轴对象。坐标轴对象包含2楼梯,类型的对象。这些对象代表经验提供kernel-bw:违约。

ksdensity似乎光滑的累积分布函数估计太多。估计有一个较小的带宽可能会产生一个经验累积分布函数的估算。

返回的带宽平滑窗口。

bw

bw = 0.1070

情节累积分布函数的估计使用一个较小的带宽。

[f, xi] = ksdensity (hospital.Weight、分“万博1manbetx支持”,“积极”,…“函数”,“提供”,“带宽”,0.05);情节(xi, f,“——r”,“线宽”2)传说(“经验提供”,“kernel-bw:违约”,“kernel-bw: 0.05”,…“位置”,“西北”)举行从

图包含一个坐标轴对象。坐标轴对象包含3楼梯,类型的对象。这些对象代表经验提供kernel-bw:默认情况下,kernel-bw: 0.05。

的ksdensity估计小带宽匹配经验累积分布函数更好。

情节估计累积密度函数对于给定数量的点

打开生活的脚本

加载示例数据。

负载医院

情节估计cdf评估在50岁等距的点。

图()ksdensity (hospital.Weight,“万博1manbetx支持”,“积极”,“函数”,“提供”,…“NumPoints”,50)包含(“病人体重”)ylabel (“估计提供”)

图包含一个坐标轴对象。坐标轴对象包含一个类型的对象。

估计幸存者和累积风险审查失败的数据

打开生活的脚本

生成样本数据的指数分布与平均3。

rng (“默认”)%的再现性随机(x =“经验”,3100,(1);

创建一个逻辑向量表示审查。在这里,观察与寿命超过10审查。

T = 10;岑= (x > T);

计算和绘制估计密度函数。

图ksdensity (x,“万博1manbetx支持”,“积极”,“审查”岑);

图包含一个坐标轴对象。坐标轴对象包含一个类型的对象。

函数计算和绘制的幸存者。

图ksdensity (x,“万博1manbetx支持”,“积极”,“审查”岑,…“函数”,“幸存者”);

图包含一个坐标轴对象。坐标轴对象包含一个类型的对象。

计算和绘制累积风险函数。

图ksdensity (x,“万博1manbetx支持”,“积极”,“审查”岑,…“函数”,“cumhazard”);

图包含一个坐标轴对象。坐标轴对象包含一个类型的对象。

估计逆累积概率分布函数为指定值

打开生活的脚本

生成两个正态分布的混合物,和情节估计逆累积分布函数在指定的概率值。

rng (“默认”)%的再现性1 x = [randn(30日);5 + randn(30日1)];π= linspace (0 . 01, 99);图ksdensity (x,π,“函数”,“icdf”);

图包含一个坐标轴对象。坐标轴对象包含一个类型的对象。

返回的带宽平滑窗口

打开生活的脚本

生成两个正态分布的混合物。

rng (“默认”)%的再现性1 x = [randn(30日);5 + randn(30日1)];

返回的带宽平滑窗口概率密度估计。

(f, xi, bw) = ksdensity (x);bw

bw = 1.5141

默认的带宽对正常密度是最优的。

情节估计的密度。

图绘制(xi, f);包含(“十一”)ylabel (“f”)举行在

图包含一个坐标轴对象。坐标轴对象包含一个类型的对象。

情节密度使用增加的带宽值。

[f, xi] = ksdensity (x,“带宽”,1.8);情节(xi, f,“——r”,“线宽”,1.5)

图包含一个坐标轴对象。坐标轴对象包含2线类型的对象。

更高的带宽进一步抚平密度估计,这可能会掩盖一些分布的特征。

现在,情节密度使用减少带宽值。

[f, xi] = ksdensity (x,“带宽”,0.8);情节(xi, f,“同意”,“线宽”传说,1.5)(“bw =违约”,“bw = 1.8”,“bw = 0.8”)举行从

图包含一个坐标轴对象。坐标轴对象包含3线类型的对象。这些对象代表bw =违约,bw = 1.8, bw = 0.8。

较小的带宽平滑密度估计少,夸大了一些样本的特征。

情节核密度估计的二元数据

打开生活的脚本

创建一个两列向量的点密度的评价。

gridx1 = -0.25: .05:1.25;gridx2 = 0: .1:15;(x1, x2) = meshgrid (gridx1 gridx2);x1 = x1 (:);x2 = x2 (:);ξ= (x1, x2));

生成一个30-by-2矩阵包含二元正态分布的随机数从混合物中。

rng (“默认”)%的再现性x =[0兰德(20日1)+ 5 * 5 + 2.5 *兰德(20日1);综合成绩+ .25 *兰德(10,1)8.75 + 1.25 *兰德(10,1)];

情节的估计密度示例数据。

图ksdensity (x, xi);

图包含一个坐标轴对象。坐标轴对象包含一个类型的对象的表面。

输入参数

全部折叠

`x`- - - - - -样本数据
列向量|两列矩阵

样本数据的ksdensity返回f值,指定为一个列向量或两列矩阵。对单变量数据使用一个列向量,一个两列二维数据矩阵。

例子:[f, xi] = ksdensity (x)

数据类型:单|双

`分`- - - - - -点评估`f`
向量|两列矩阵

点评估f指定为一个向量或两列矩阵。对于单变量数据,分可以是一行或列向量。返回的输出的长度f等于点的数量分。

例子:分= (0:1:25);ksdensity (x,分);

数据类型:单|双

`斧头`- - - - - -轴处理
处理

轴图处理ksdensity情节,指定为一个句柄。

例如,如果h是一个图的处理呢ksdensity可以画出图,如下所示。

例子:ksdensity (h, x)

名称-值参数

指定可选的双参数作为Name1 = Value1,…,以=家,在那里的名字参数名称和吗价值相应的价值。名称-值参数必须出现在其他参数,但对的顺序无关紧要。

R2021a之前,用逗号来分隔每一个名称和值,并附上的名字在报价。

例子:“审查”,岑,“内核”、“三角形”,“NumPoints”, 20岁的“函数”,“提供”指定ksdensity估计,它强调通过评估20等距的点覆盖范围的数据,使用三角形内核审查数据的平滑函数和会计信息向量岑。

`带宽`- - - - - -内核的带宽平滑窗口
最优值为正常密度(默认)|标量值|双元素向量

kernel-smoothing窗口的带宽,这是一个功能点的数量x,指定为逗号分隔两人组成的“带宽”和一个标量值。如果样品数据是二元的,带宽也可以是双元素向量。默认是最优估计正常密度[1],但是你可能想要选择一个更大或更小的值平滑或多或少。

如果您指定“BoundaryCorrection”作为“日志”(默认),“万博1manbetx支持”作为“积极”或一个向量(L U),ksdensity将有界无界使用对数转换数据。的价值“带宽”在转换后的值的规模。

例子:“带宽”,0.8

数据类型:单|双

`BoundaryCorrection`- - - - - -边界修正法
“日志”(默认)|“反射”

边界修正方法,指定为逗号分隔组成的“BoundaryCorrection”和“日志”或“反射”。

价值描述

价值	描述
`“日志”`	`ksdensity`转换的数据`x`被一个无限的转换。然后,它将回到原来的有界规模后密度估计。对于单变量数据,如果你指定`“万博1manbetx支持”,“积极”`,然后`ksdensity`适用于`日志(x)`。对于单变量数据,如果你指定`“万博1manbetx支持”,[L U]`,在那里`l`和`U`是数字标量和`L < U`,然后`ksdensity`适用于`日志((xl) / (U-x))`。对于二元数据,`ksdensity`将每一列的`x`以同样的方式与单变量数据。的价值`“带宽”`和`bw`输出的转换后的值。
`“反射”`	`ksdensity`增加有限的数据通过添加反射边界附近的数据,然后它返回估计对应于原始的支持。万博1manbetx有关详细信息,请参见反射法。

“日志”

ksdensity转换的数据x被一个无限的转换。然后,它将回到原来的有界规模后密度估计。

对于单变量数据,如果你指定“万博1manbetx支持”,“积极”,然后ksdensity适用于日志(x)。
对于单变量数据,如果你指定“万博1manbetx支持”,[L U],在那里l和U是数字标量和L < U,然后ksdensity适用于日志((xl) / (U-x))。
对于二元数据,ksdensity将每一列的x以同样的方式与单变量数据。

的价值“带宽”和bw输出的转换后的值。

“反射”

ksdensity增加有限的数据通过添加反射边界附近的数据,然后它返回估计对应于原始的支持。万博1manbetx有关详细信息,请参见反射法。

ksdensity只有当你指定适用边界修正“万博1manbetx支持”除了作为一个值“无限”。

例子:“BoundaryCorrection”、“反射”

`审查`- - - - - -逻辑向量
向量的0(默认)|0和1的向量

逻辑向量表示审查哪些条目,指定为逗号分隔组成的“审查”和一个向量二进制值。值0表示没有审查,1表明,观察是审查。默认是没有审查。这个名称-值对只适用于单变量数据。

例子:“审查”,censdata

数据类型:逻辑

`函数`- - - - - -函数来估计
`“pdf”`(默认)|`“提供”`|`“icdf”`|`“幸存者”`|`“cumhazard”`

函数来估计,指定为逗号分隔组成的“函数”和一个以下。

价值	描述
`“pdf”`	概率密度函数。
`“提供”`	累积分布函数。
`“icdf”`	逆累积分布函数。`ksdensity`计算估计逆cdf的价值观`x`在指定的概率值,评估它`π`。这个值是有效的只有一元数据。
`“幸存者”`	幸存者的功能。
`“cumhazard”`	累积风险函数。这个值是有效的只有一元数据。

例子:“函数”,“icdf”

`内核`- - - - - -类型的内核流畅
`“正常”`(默认)|`“盒子”`|`“三角形”`|`“epanechnikov”`|函数处理|特征向量|字符串标量

类型的内核平滑,指定为逗号分隔组成的“内核”和一个以下。

“正常”(默认)
“盒子”
“三角形”
“epanechnikov”
一个内核函数,是一个自定义或内置函数。指定函数作为函数处理(例如,@myfunction或@normpdf)或作为特征向量或字符串标量(例如,“myfunction”或“normpdf”)。软件调用指定的函数有一个参数是一个数组的数据值之间的距离和位置的密度是评价。同样大小的函数必须返回一个数组包含相应的内核函数的值。
当“函数”是“pdf”密度,内核函数返回值。否则,它将返回累积概率值。
指定一个自定义内核时“函数”是“icdf”返回一个错误。

对于二元数据,ksdensity同样的内核适用于每个维度。

例子:“内核”、“盒子”

`NumPoints`- - - - - -等距的点的数量
One hundred.(默认)|标量值

等距的点的数量习,指定为逗号分隔两人组成的“NumPoints”和一个标量值。这个名称-值对只适用于单变量数据。

例如,对于一个内核指定函数的光滑估计在80等距的点样本数据的范围内,输入:

例子:“NumPoints”, 80年

数据类型:单|双

`万博1manbetx`- - - - - -万博1manbetx支持的密度
`“无限”`(默认)|`“积极”`|双元素向量,`(L U)`|2乘2矩阵,`(L1 L2;U1 U2)`

万博1manbetx支持密度,指定为逗号分隔组成的“万博1manbetx支持”和一个以下。

价值	描述
`“无限”`	违约。允许密度扩展在整个实线。
`“积极”`	将密度限制在积极的价值观。
双元素向量,`(L U)`	给有限的上下边界密度的支持。万博1manbetx此选项只适用于单变量示例数据。
2乘2矩阵,`(L1 L2;U1 U2)`	给有限的上下边界密度的支持。万博1manbetx第一行包含下限和第二行包含了上限。此选项只适用于二元示例数据。

对于二元数据,“万博1manbetx支持”可以积极的、无限的,或有界变量指定为[0负无穷;正正)或[0 L;正你)。

例子:“万博1manbetx支持”,“积极”

例子:“万博1manbetx支持”,[0 10]

数据类型:单|双|字符|字符串

`PlotFcn`- - - - - -函数用于创建内核密度图
`“冲浪”`(默认)|`“轮廓”`|`“plot3”`|`“surfc”`

函数用于创建内核密度图,指定为逗号分隔组成的“PlotFcn”和一个以下。

价值	描述
`“冲浪”`	三维阴影曲面图,使用创建的`冲浪`
`“轮廓”`	等高线图,使用创建的`轮廓`
`“plot3”`	三维线情节,使用创建的`plot3`
`“surfc”`	等高线图三维阴影曲面图,使用创建的`surfc`

这个名称-值对只是二元样本数据有效。

例子:“PlotFcn”、“轮廓”

`权重`- - - - - -权重的样本数据
向量

权重为样本数据,指定为逗号分隔组成的“重量”和一个向量的长度大小(x, 1),在那里x示例数据。

例子:“重量”,xw

数据类型:单|双

输出参数

全部折叠

`f`——估计函数值
向量

估计函数值,作为一个向量的长度等于返回点的数量习或分。

`习`——评估点
100等距点| 900等距点| |两列向量矩阵

评估点的ksdensity计算f,作为一个向量或返回一个两列矩阵。对于单变量数据,默认是100条平行的点覆盖范围的数据x。对于二元数据,默认是900条平行的点创建使用meshgrid在每个维度从30条平行的点。

`bw`带宽的平滑窗口
标量值

带宽的平滑窗口,作为一个标量值返回。

如果您指定“BoundaryCorrection”作为“日志”(默认),“万博1manbetx支持”作为“积极”或一个向量(L U),ksdensity将有界无界使用对数转换数据。的价值bw在转换后的值的规模。

引用

[1]鲍曼,a·W。,A. Azzalini.应用平滑技术进行数据分析。纽约:牛津大学出版社有限公司,1997年。

[2],p·d·“内核分布函数的估计。”通信在统计理论和方法。问题。3卷14日,1985年,页605 - 620。

琼斯[3],m . c .“简单边界修正核密度估计。”统计和计算。3卷,第三期,1993年,页135 - 146。

[4]西尔弗曼,b . W。密度估计的统计和数据分析。查普曼&大厅/ CRC, 1986。

扩展功能

高大的数组
计算和数组的行比装入内存。

这个函数支持高数组内存不足数万博1manbetx据和一些限制。

一些选项,需要额外的通过或不支持输入数据的排序:万博1manbetx
- “BoundaryCorrection”
- “审查”
- “万博1manbetx支持”(万博1manbetx支持总是无限)。
使用标准偏差(而不是平均绝对偏差)计算带宽。

有关更多信息,请参见高内存不足数据数组。

C / c++代码生成
生成C和c++代码使用MATLAB®编码器™。

使用笔记和限制:

不支持策划。万博1manbetx
名字必须编译时常量参数名称-值对。
在以下名称-值对参数值也必须编译时常量:“BoundaryCorrection”,“函数”,“内核”。例如,使用“函数”、“提供”名称-值对的论点在生成的代码,包括{coder.Constant(函数),coder.Constant (cdf)}在arg游戏的价值codegen。
的值“内核”名称-值对的论点不能自定义函数处理。指定一个自定义内核函数,使用一个特征向量或字符串标量。
的价值“万博1manbetx支持”名称-值对参数,编译时的数据类型必须匹配运行时数据类型。

代码生成的更多信息,请参阅介绍代码生成和通用代码生成工作流。

GPU数组
加速代码运行在一个图形处理单元(GPU)使用并行计算工具箱™。

这个函数完全支持GPU数组。万博1manbetx有关更多信息,请参见运行在GPU MATLAB函数(并行计算工具箱)。

版本历史

之前介绍过的R2006a

另请参阅

柱状图|mvksdensity

ksdensity

语法

描述

例子

估计密度

估计与边界密度修正

估计累积分布函数在指定值

情节估计累积密度函数对于给定数量的点

估计幸存者和累积风险审查失败的数据

估计逆累积概率分布函数为指定值

返回的带宽平滑窗口

情节核密度估计的二元数据

输入参数

x- - - - - -样本数据列向量|两列矩阵

分- - - - - -点评估f向量|两列矩阵

斧头- - - - - -轴处理处理

名称-值参数

带宽- - - - - -内核的带宽平滑窗口最优值为正常密度(默认)|标量值|双元素向量

BoundaryCorrection- - - - - -边界修正法“日志”(默认)|“反射”

审查- - - - - -逻辑向量向量的0(默认)|0和1的向量

函数- - - - - -函数来估计“pdf”(默认)|“提供”|“icdf”|“幸存者”|“cumhazard”

内核- - - - - -类型的内核流畅“正常”(默认)|“盒子”|“三角形”|“epanechnikov”|函数处理|特征向量|字符串标量

NumPoints- - - - - -等距的点的数量One hundred.(默认)|标量值

万博1manbetx- - - - - -万博1manbetx支持的密度“无限”(默认)|“积极”|双元素向量,(L U)|2乘2矩阵,(L1 L2;U1 U2)

PlotFcn- - - - - -函数用于创建内核密度图“冲浪”(默认)|“轮廓”|“plot3”|“surfc”

权重- - - - - -权重的样本数据向量

输出参数

f——估计函数值向量

习——评估点100等距点| 900等距点| |两列向量矩阵

bw带宽的平滑窗口标量值

更多关于

内核分配

反射法

引用

扩展功能

高大的数组计算和数组的行比装入内存。

C / c++代码生成生成C和c++代码使用MATLAB®编码器™。

GPU数组加速代码运行在一个图形处理单元(GPU)使用并行计算工具箱™。

版本历史

另请参阅

主题

`x`- - - - - -样本数据
列向量|两列矩阵

`分`- - - - - -点评估`f`
向量|两列矩阵

`斧头`- - - - - -轴处理
处理

`带宽`- - - - - -内核的带宽平滑窗口
最优值为正常密度(默认)|标量值|双元素向量

`BoundaryCorrection`- - - - - -边界修正法
“日志”(默认)|“反射”

`审查`- - - - - -逻辑向量
向量的0(默认)|0和1的向量

`函数`- - - - - -函数来估计
`“pdf”`(默认)|`“提供”`|`“icdf”`|`“幸存者”`|`“cumhazard”`

`内核`- - - - - -类型的内核流畅
`“正常”`(默认)|`“盒子”`|`“三角形”`|`“epanechnikov”`|函数处理|特征向量|字符串标量

`NumPoints`- - - - - -等距的点的数量
One hundred.(默认)|标量值

`万博1manbetx`- - - - - -万博1manbetx支持的密度
`“无限”`(默认)|`“积极”`|双元素向量,`(L U)`|2乘2矩阵,`(L1 L2;U1 U2)`

`PlotFcn`- - - - - -函数用于创建内核密度图
`“冲浪”`(默认)|`“轮廓”`|`“plot3”`|`“surfc”`

`权重`- - - - - -权重的样本数据
向量

`f`——估计函数值
向量

`习`——评估点
100等距点| 900等距点| |两列向量矩阵

`bw`带宽的平滑窗口
标量值

高大的数组
计算和数组的行比装入内存。

C / c++代码生成
生成C和c++代码使用MATLAB®编码器™。

GPU数组
加速代码运行在一个图形处理单元(GPU)使用并行计算工具箱™。