ksdensity
内核平滑函数估计为单变量和二元数据
语法
描述
例子
估计密度
生成一个样本数据集的两个正态分布的混合物。
rng (“默认”)%的再现性1 x = [randn(30日);5 + randn(30日1)];
情节估计的密度。
[f, xi] = ksdensity (x);图绘制(xi, f);
样品的密度估计显示双峰性。
估计与边界密度修正
从half-normal生成非负样本数据集分布。
rng (“默认”)%的再现性pd = makedist (“HalfNormal”,“亩”0,“σ”1);x =随机(pd, 100, (1);
估计pdf与两种不同的边界修正方法,对数转换和反思,通过使用“BoundaryCorrection”
名称-值对的论点。
分= linspace (0, 1000);%点评价估计量[f1,ξ1]= ksdensity (x,分,“万博1manbetx支持”,“积极”);(f2,ξ2))= ksdensity (x,分,“万博1manbetx支持”,“积极”,“BoundaryCorrection”,“反射”);
画出两个估计的pdf文件。
f1情节(ξ1,ξ2,f2)乐金显示器=传奇(“日志”,“反射”);标题(乐金显示器,“边界修正法”)xl = xlim;xlim ([-0.25 xl xl (1) (2)))
ksdensity
使用边界修正方法当你指定或正面或有界的支持。万博1manbetx默认的日志转换边界修正方法。当ksdensity
转换的支持,它介绍了万博1manbetx1 / x
术语的核密度估计量。因此,估计有一个峰值附近x = 0
。另一方面,反射法不会引起不良的山峰在边界附近。
估计累积分布函数在指定值
加载示例数据。
负载医院
计算和情节估计cdf评估在指定的一组值。
分= (min (hospital.Weight): 2:马克斯(hospital.Weight));图()ecdf (hospital.Weight)在(f, xi, bw) = ksdensity (hospital.Weight、分“万博1manbetx支持”,“积极”,…“函数”,“提供”);情节(xi, f,“g”,“线宽”2)传说(“经验提供”,“kernel-bw:违约”,“位置”,“西北”)包含(“病人体重”)ylabel (“估计提供”)
ksdensity
似乎光滑的累积分布函数估计太多。估计有一个较小的带宽可能会产生一个经验累积分布函数的估算。
返回的带宽平滑窗口。
bw
bw = 0.1070
情节累积分布函数的估计使用一个较小的带宽。
[f, xi] = ksdensity (hospital.Weight、分“万博1manbetx支持”,“积极”,…“函数”,“提供”,“带宽”,0.05);情节(xi, f,“——r”,“线宽”2)传说(“经验提供”,“kernel-bw:违约”,“kernel-bw: 0.05”,…“位置”,“西北”)举行从
的ksdensity
估计小带宽匹配经验累积分布函数更好。
情节估计累积密度函数对于给定数量的点
加载示例数据。
负载医院
情节估计cdf评估在50岁等距的点。
图()ksdensity (hospital.Weight,“万博1manbetx支持”,“积极”,“函数”,“提供”,…“NumPoints”,50)包含(“病人体重”)ylabel (“估计提供”)
估计幸存者和累积风险审查失败的数据
生成样本数据的指数分布与平均3。
rng (“默认”)%的再现性随机(x =“经验”,3100,(1);
创建一个逻辑向量表示审查。在这里,观察与寿命超过10审查。
T = 10;岑= (x > T);
计算和绘制估计密度函数。
图ksdensity (x,“万博1manbetx支持”,“积极”,“审查”岑);
函数计算和绘制的幸存者。
图ksdensity (x,“万博1manbetx支持”,“积极”,“审查”岑,…“函数”,“幸存者”);
计算和绘制累积风险函数。
图ksdensity (x,“万博1manbetx支持”,“积极”,“审查”岑,…“函数”,“cumhazard”);
估计逆累积概率分布函数为指定值
生成两个正态分布的混合物,和情节估计逆累积分布函数在指定的概率值。
rng (“默认”)%的再现性1 x = [randn(30日);5 + randn(30日1)];π= linspace (0 . 01, 99);图ksdensity (x,π,“函数”,“icdf”);
返回的带宽平滑窗口
生成两个正态分布的混合物。
rng (“默认”)%的再现性1 x = [randn(30日);5 + randn(30日1)];
返回的带宽平滑窗口概率密度估计。
(f, xi, bw) = ksdensity (x);bw
bw = 1.5141
默认的带宽对正常密度是最优的。
情节估计的密度。
图绘制(xi, f);包含(“十一”)ylabel (“f”)举行在
情节密度使用增加的带宽值。
[f, xi] = ksdensity (x,“带宽”,1.8);情节(xi, f,“——r”,“线宽”,1.5)
更高的带宽进一步抚平密度估计,这可能会掩盖一些分布的特征。
现在,情节密度使用减少带宽值。
[f, xi] = ksdensity (x,“带宽”,0.8);情节(xi, f,“同意”,“线宽”传说,1.5)(“bw =违约”,“bw = 1.8”,“bw = 0.8”)举行从
较小的带宽平滑密度估计少,夸大了一些样本的特征。
情节核密度估计的二元数据
创建一个两列向量的点密度的评价。
gridx1 = -0.25: .05:1.25;gridx2 = 0: .1:15;(x1, x2) = meshgrid (gridx1 gridx2);x1 = x1 (:);x2 = x2 (:);ξ= (x1, x2));
生成一个30-by-2矩阵包含二元正态分布的随机数从混合物中。
rng (“默认”)%的再现性x =[0兰德(20日1)+ 5 * 5 + 2.5 *兰德(20日1);综合成绩+ .25 *兰德(10,1)8.75 + 1.25 *兰德(10,1)];
情节的估计密度示例数据。
图ksdensity (x, xi);
输入参数
x
- - - - - -样本数据
列向量|两列矩阵
分
- - - - - -点评估f
向量|两列矩阵
斧头
- - - - - -轴处理
处理
轴图处理ksdensity
情节,指定为一个句柄。
例如,如果h
是一个图的处理呢ksdensity
可以画出图,如下所示。
例子:ksdensity (h, x)
名称-值参数
指定可选的双参数作为Name1 = Value1,…,以=家
,在那里的名字
参数名称和吗价值
相应的价值。名称-值参数必须出现在其他参数,但对的顺序无关紧要。
R2021a之前,用逗号来分隔每一个名称和值,并附上的名字
在报价。
例子:“审查”,岑,“内核”、“三角形”,“NumPoints”, 20岁的“函数”,“提供”
指定ksdensity
估计,它强调通过评估20等距的点覆盖范围的数据,使用三角形内核审查数据的平滑函数和会计信息向量岑
。
带宽
- - - - - -内核的带宽平滑窗口
最优值为正常密度(默认)|标量值|双元素向量
kernel-smoothing窗口的带宽,这是一个功能点的数量x
,指定为逗号分隔两人组成的“带宽”
和一个标量值。如果样品数据是二元的,带宽
也可以是双元素向量。默认是最优估计正常密度[1],但是你可能想要选择一个更大或更小的值平滑或多或少。
如果您指定“BoundaryCorrection”
作为“日志”
(默认),“万博1manbetx支持”
作为“积极”
或一个向量(L U)
,ksdensity
将有界无界使用对数转换数据。的价值“带宽”
在转换后的值的规模。
例子:“带宽”,0.8
数据类型:单
|双
BoundaryCorrection
- - - - - -边界修正法
“日志”(默认)|“反射”
边界修正方法,指定为逗号分隔组成的“BoundaryCorrection”
和“日志”
或“反射”
。
价值 | 描述 |
---|---|
“日志” |
|
“反射” |
|
ksdensity
只有当你指定适用边界修正“万博1manbetx支持”
除了作为一个值“无限”
。
例子:“BoundaryCorrection”、“反射”
审查
- - - - - -逻辑向量
向量的0(默认)|0和1的向量
逻辑向量表示审查哪些条目,指定为逗号分隔组成的“审查”
和一个向量二进制值。值0表示没有审查,1表明,观察是审查。默认是没有审查。这个名称-值对只适用于单变量数据。
例子:“审查”,censdata
数据类型:逻辑
函数
- - - - - -函数来估计
“pdf”
(默认)|“提供”
|“icdf”
|“幸存者”
|“cumhazard”
函数来估计,指定为逗号分隔组成的“函数”
和一个以下。
价值 | 描述 |
---|---|
“pdf” |
概率密度函数。 |
“提供” |
累积分布函数。 |
“icdf” |
逆累积分布函数。 这个值是有效的只有一元数据。 |
“幸存者” |
幸存者的功能。 |
“cumhazard” |
累积风险函数。 这个值是有效的只有一元数据。 |
例子:“函数”
,“icdf”
内核
- - - - - -类型的内核流畅
“正常”
(默认)|“盒子”
|“三角形”
|“epanechnikov”
|函数处理|特征向量|字符串标量
类型的内核平滑,指定为逗号分隔组成的“内核”
和一个以下。
“正常”
(默认)“盒子”
“三角形”
“epanechnikov”
一个内核函数,是一个自定义或内置函数。指定函数作为函数处理(例如,
@myfunction
或@normpdf
)或作为特征向量或字符串标量(例如,“myfunction”
或“normpdf”
)。软件调用指定的函数有一个参数是一个数组的数据值之间的距离和位置的密度是评价。同样大小的函数必须返回一个数组包含相应的内核函数的值。当
“函数”
是“pdf”
密度,内核函数返回值。否则,它将返回累积概率值。指定一个自定义内核时
“函数”
是“icdf”
返回一个错误。
对于二元数据,ksdensity
同样的内核适用于每个维度。
例子:“内核”、“盒子”
NumPoints
- - - - - -等距的点的数量
One hundred.(默认)|标量值
等距的点的数量习
,指定为逗号分隔两人组成的“NumPoints”
和一个标量值。这个名称-值对只适用于单变量数据。
例如,对于一个内核指定函数的光滑估计在80等距的点样本数据的范围内,输入:
例子:“NumPoints”, 80年
数据类型:单
|双
万博1manbetx
- - - - - -万博1manbetx支持的密度
“无限”
(默认)|“积极”
|双元素向量,(L U)
|2乘2矩阵,(L1 L2;U1 U2)
万博1manbetx支持密度,指定为逗号分隔组成的“万博1manbetx支持”
和一个以下。
价值 | 描述 |
---|---|
“无限” |
违约。允许密度扩展在整个实线。 |
“积极” |
将密度限制在积极的价值观。 |
双元素向量,(L U) |
给有限的上下边界密度的支持。万博1manbetx此选项只适用于单变量示例数据。 |
2乘2矩阵,(L1 L2;U1 U2) |
给有限的上下边界密度的支持。万博1manbetx第一行包含下限和第二行包含了上限。此选项只适用于二元示例数据。 |
对于二元数据,“万博1manbetx支持”
可以积极的、无限的,或有界变量指定为[0负无穷;正正)
或[0 L;正你)
。
例子:“万博1manbetx支持”,“积极”
例子:“万博1manbetx支持”,[0 10]
数据类型:单
|双
|字符
|字符串
权重
- - - - - -权重的样本数据
向量
输出参数
bw
带宽的平滑窗口
标量值
带宽的平滑窗口,作为一个标量值返回。
如果您指定“BoundaryCorrection”
作为“日志”
(默认),“万博1manbetx支持”
作为“积极”
或一个向量(L U)
,ksdensity
将有界无界使用对数转换数据。的价值bw
在转换后的值的规模。
更多关于
内核分配
一个内核分布的非参数表示随机变量的概率密度函数(pdf)。您可以使用一个内核分布参数时不能正确描述数据,或者当你想避免对数据的分布进行假设。内核分布定义为一个平滑函数和一个带宽值,控制产生的密度曲线的平滑度。
核密度估计量是一个随机变量的估计pdf。对于任何真正的价值x核密度估计的公式是由
在哪里x1,x2、…xn从一个未知的随机抽样分布,n是样品的尺寸, 是内核平滑函数,h是带宽。
累积分布函数的核估计量(cdf),对于任何真正的价值x的话,是
在哪里 。
更多细节,请参阅内核分配。
反射法
反射法是一个边界修正法,准确地发现核密度估计当随机变量有界的支持。万博1manbetx如果您指定“BoundaryCorrection”、“反射”
,ksdensity
使用反射法。这种方法增加有限的数据通过添加反映数据在边界附近,并估计pdf。然后,ksdensity
返回估计pdf对应于原始支持通过适当的归一化,这样估计pdf的积分等于1最初的支持。万博1manbetx
如果您另外指定“万博1manbetx支持”,[L U]
,然后ksdensity
发现内核估计如下。
如果
“函数”
是“pdf”
,核密度估计为l≤x≤U,
在哪里 , ,x我是
我
示例数据。如果
“函数”
是“提供”
,那么内核对cdf实验组的估计量为l≤x≤U。
获得一个内核逆cdf实验组的估计,一个幸存者函数,或累积风险函数(当
“函数”
是“icdf”
,“幸存者”
,或“cumhazrd”
),ksdensity
使用两种 和 。
如果您另外指定“万博1manbetx支持”
作为“积极”
或[0正]
,然后ksdensity
发现内核估计值代替(L U)
与[0正]
在上面的方程。
引用
[1]鲍曼,a·W。,A. Azzalini.应用平滑技术进行数据分析。纽约:牛津大学出版社有限公司,1997年。
[2],p·d·“内核分布函数的估计。”通信在统计理论和方法。问题。3卷14日,1985年,页605 - 620。
琼斯[3],m . c .“简单边界修正核密度估计。”统计和计算。3卷,第三期,1993年,页135 - 146。
[4]西尔弗曼,b . W。密度估计的统计和数据分析。查普曼&大厅/ CRC, 1986。
扩展功能
高大的数组
计算和数组的行比装入内存。
这个函数支持高数组内存不足数万博1manbetx据和一些限制。
一些选项,需要额外的通过或不支持输入数据的排序:万博1manbetx
“BoundaryCorrection”
“审查”
“万博1manbetx支持”
(万博1manbetx支持总是无限)。
使用标准偏差(而不是平均绝对偏差)计算带宽。
有关更多信息,请参见高内存不足数据数组。
C / c++代码生成
生成C和c++代码使用MATLAB®编码器™。
使用笔记和限制:
不支持策划。万博1manbetx
名字必须编译时常量参数名称-值对。
在以下名称-值对参数值也必须编译时常量:
“BoundaryCorrection”
,“函数”
,“内核”
。例如,使用“函数”、“提供”
名称-值对的论点在生成的代码,包括{coder.Constant(函数),coder.Constant (cdf)}
在arg游戏
的价值codegen
。的值
“内核”
名称-值对的论点不能自定义函数处理。指定一个自定义内核函数,使用一个特征向量或字符串标量。的价值
“万博1manbetx支持”
名称-值对参数,编译时的数据类型必须匹配运行时数据类型。
GPU数组
加速代码运行在一个图形处理单元(GPU)使用并行计算工具箱™。
这个函数完全支持GPU数组。万博1manbetx有关更多信息,请参见运行在GPU MATLAB函数(并行计算工具箱)。
版本历史
之前介绍过的R2006a
Abrir比如
这种版本modificada德埃斯特比如。害怕Desea abrir埃斯特比如con sus modificaciones吗?
第一de MATLAB
Ha事实clic en联合国围绕此时一个埃斯特第一de MATLAB:
Ejecute el第一introduciendolo en la ventana de第一de MATLAB。洛杉矶navegadores网络没有admiten第一de MATLAB。
你也可以从下面的列表中选择一个网站:
表现最好的网站怎么走吗
选择中国网站(中文或英文)最佳站点的性能。其他MathWorks国家网站不优化的访问你的位置。