이페이지의최신내용은아직번역되지않았습니다。최신내용은영문으로볼수있습니다。
일변량데이터와이변량데이터에대한커널스무딩함수추정값
두개의혼합된정규분포에서표본데이터세트를생성합니다。
rng (“默认”)%的再现性1 x = [randn(30日);5 + randn(30日1)];
추정된밀도를플로팅합니다。
[f, xi] = ksdensity (x);图情节(XI中,f);
밀도추정값은표본의이봉분포를보여줍니다。
절반정규분포에서음이아닌표본데이터세트를생성합니다。
rng (“默认”)%的再现性PD = makedist(“HalfNormal”,“亩”0,“西格玛”,1);X =随机(PD,100,1);
“BoundaryCorrection”
이름 - 값쌍의인수를사용하여두개의서로다른경계수정방법인로그변환과반사를통해PDF를추정합니다。
PTS = linspace(0,5,1000);%表示对估计值进行评估[F1,XI1] = ksdensity(X,PTS,'万博1manbetx支持',“积极”);(f2,ξ2))= ksdensity (x,分,'万博1manbetx支持',“积极”,“BoundaryCorrection”,“反射”);
추정된두pdf를플로팅합니다。
plot(xi1,f1,xi2,f2) lgd = legend(“日志”,“反射”);标题(乐金显示器,“边界校正方法”) xl = xlim;xlim ([-0.25 xl xl (1) (2)))
양의지지범위또는유계지지범위를지정하면ksdensity
는경계수정방법을사용합니다。디폴트경계수정방법은로그변환입니다。ksdensity
가지지범위를다시변환할경우커널밀도추정량에1 / x
항이추가됩니다。따라서,추정값은x = 0
근방에서피크를가집니다。반면,반사방법은경계근처에서원치않는피크를발생시키지않습니다。
표본데이터를불러옵니다。
加载医院
지정된값세트에서추정된CDF를계산하고플로팅합니다。
分= (min (hospital.Weight): 2:马克斯(hospital.Weight));图()ecdf (hospital.Weight)在并[f,XI,BW] = ksdensity(hospital.Weight,PTS,'万博1manbetx支持',“积极”,…'功能',“提供”);图(十一,F,'-G',“线宽”2)传说(“经验CDF”,“kernel-bw:违约”,“位置”,“西北”)包含(“患者体重”)ylabel (“估计CDF”)
ksdensity
가누적분포함수추정값을너무많이스무딩하는것처럼보입니다。더작은대역폭을가지는추정값이경험적누적분포함수에더가까운추정값을생성할가능성이있습니다。
스무딩윈도우의대역폭을반환합니다。
BW
BW = 0.1070
더작은대역폭을사용하여누적분포함수추정값을플로팅합니다。
[f, xi] = ksdensity (hospital.Weight、分'万博1manbetx支持',“积极”,…'功能',“提供”,'带宽',0.05);图(十一,F,“——r”,“线宽”2)传说(“经验CDF”,“kernel-bw:违约”,“kernel-bw: 0.05”,…“位置”,“西北”)举行离
더작은대역폭을사용한ksdensity
추정값이경험적누적분포함수와더잘일치합니다。
표본데이터를불러옵니다。
加载医院
균일한간격으로배치된50개점에서계산된추정된cdf를플로팅합니다。
图()ksdensity (hospital.Weight,'万博1manbetx支持',“积极”,'功能',“提供”,…“NumPoints”,50)xlabel(“患者体重”)ylabel (“估计CDF”)
평균3인이지수분포에서표본데이터를생성합니다。
rng (“默认”)%的再现性随机(x ='EXP',3100,(1);
중도절단을나타내는논리형벡터를생성합니다。10,수여기서명이보다긴관측값은중도절단됩니다。
T = 10;岑= (x > T);
추정된밀도함수를계산하고플로팅합니다。
图ksdensity (x,'万博1manbetx支持',“积极”,“审查”岑);
생존함수를계산하고플로팅합니다。
图ksdensity (x,'万博1manbetx支持',“积极”,“审查”岑,…'功能','幸存者');
누적위험함수를계산하고플로팅합니다。
图ksdensity (x,'万博1manbetx支持',“积极”,“审查”岑,…'功能','cumhazard');
두개의혼합된정규분포를생성하고지정된확률값세트에서추정된역누적분포함수를플로팅합니다。
rng (“默认”)%的再现性1 x = [randn(30日);5 + randn(30日1)];π= linspace (0 . 01, 99);图ksdensity (x,π,'功能','ICDF');
두개의혼합된정규분포를생성합니다。
rng (“默认”)%的再现性1 x = [randn(30日);5 + randn(30日1)];
확률밀도추정값에대한스무딩윈도우의대역폭을반환합니다。
(f, xi, bw) = ksdensity (x);BW
bw = 1.5141
디폴트대역폭은정규밀도에가장적합합니다。
추정된밀도를플로팅합니다。
图情节(XI中,f);xlabel(“十一”)ylabel (“f”)举行在
증가된대역폭값을사용하여밀도를플로팅합니다。
并[f,Ⅺ] = ksdensity(X,'带宽',1.8);图(十一,F,“——r”,“线宽”1.5)
대역폭이클수록밀도추정값이더스무딩되며,이경우분포의일부특징이가려질수있습니다。
이제,감소된대역폭값을사용하여밀도를플로팅합니다。
并[f,Ⅺ] = ksdensity(X,'带宽',0.8);图(十一,F,'-.k',“线宽”传说,1.5)(“bw =违约”,'BW = 1.8','BW = 0.8')举行离
대역폭이작을수록밀도추정값이덜스무딩되며,이경우표본의일부특징이과장됩니다。
밀도를계산할점으로구성열된2벡터를생성합니다。
gridx1 = -0.25:0.05:1.25;gridx2 = 0:0.1:15;[X1,X2] = meshgrid(gridx1,gridx2);X1 = X1(:);X2 = X2(:);XI = [X1 X2];
혼합된이변량정규분포에서난수를포함하는30 x2행렬을생성합니다。
rng (“默认”)%的再现性x = [0+ 5*rand(20,1) 5+2.5*rand(20,1);综合成绩+ .25 *兰德(10,1)8.75 + 1.25 *兰德(10,1)];
표본데이터에대한추정된밀도를플로팅합니다。
图ksdensity(X,XI);
X
-표본데이터ksdensity
가F
값을반환하는데사용하는표본데이터로,열벡터또는2열행렬로지정됩니다。일변량데이터에는열벡터를사용하고,이변량데이터에는2열행렬을사용합니다。
예:并[f,Ⅺ] = ksdensity(x)的
데이터형:单
|双
分
-F
를계산할점F
를계산할점으로,벡터또는2열행렬로지정됩니다。이변량데이터에대해分
는행벡터또는열벡터일수있습니다。반환되는출력값F
의길이는分
의점개수와동일합니다。
예:分= (0:1:25);ksdensity (x,分);
데이터형:单
|双
斧头
-轴핸들ksdensity
가플로팅할图에대한轴핸들로,핸들로지정됩니다。
예를들어,H
가图에대한핸들이면ksdensity
는다음과같이해당图에대해플로팅할수있습니다。
예:ksdensity (h, x)
선택적으로名称,值
인수가쉼표로구분되어지정됩니다。여기서的名字
은인수이름이고价值
는대응값입니다。的名字
은따옴표안에표시해야합니다。Name1, Value1,…,的家
과같이여러개의이름——값쌍의인수를어떤순서로든지정할수있습니다。
“审查”,岑,“内核”、“三角形”,“NumPoints”, 20岁的“函数”,“提供”
는ksdensity
가삼각커널스무딩함수를사용하고벡터CENS
에포함된중도절단된데이터정보를고려하여데이터의범위를포괄하는균일한간격으로배치된20개의점에서계산을수행함으로써cdf를추정하는것으로지정합니다。
'带宽'
-커널스무딩윈도우의대역폭“BoundaryCorrection”
-경계수정방법경계수정방법으로,“BoundaryCorrection”
과함께“日志”
또는“反射”
이쉼표로구분되어지정됩니다。
값 | 설명 |
---|---|
“日志” |
|
“反射” |
|
ksdensity
는'万博1manbetx支持'
를“无限”
가아닌값으로지정하는경우에만경계수정을적용합니다。
예:“BoundaryCorrection”、“反射”
“审查”
-논리형벡터중도절단된항목을나타내는논리형벡터로,“审查”
과함께이진값으로구성된벡터가쉼표로구분되어지정됩니다。0값은중도절단이없음을나타내고,1은관측값이중도절단되었음을나타냅니다。디폴트값은중도절단없음입니다。이이름 - 값쌍은일변량데이터에만유효합니다。
예:'截尾',censdata
데이터형:合乎逻辑
'功能'
-추정할함수'PDF'
(디폴트값)|“提供”
|'ICDF'
|'幸存者'
|'cumhazard'
추정할함수로,'功能'
과함께다음중하나가쉼표로구분되어지정됩니다。
값 | 설명 |
---|---|
'PDF' |
확률밀도함수。 |
“提供” |
누적분포함수。 |
'ICDF' |
역누적분포함수。 이값은일변량데이터에만유효합니다。 |
'幸存者' |
생존함수。 |
'cumhazard' |
누적위험함수。 이값은일변량데이터에만유효합니다。 |
예:'功能'
,'ICDF'
'核心'
-커널스무딩유형'正常'
(디폴트값)|“盒子”
|'三角形'
|“epanechnikov”
|함수핸들|문자형벡터|串형스칼라커널스무딩유형으로,'核心'
과함께다음중하나가쉼표로구분되어지정됩니다。
'正常'
(디폴트값)
“盒子”
'三角形'
“epanechnikov”
사용자지정함수또는내장함수인커널함수。함수를함수핸들(예:@myfunction
또는@normpdf
)또는문자형벡터나字符串형스칼라(예:“myfunction”
또는“normpdf”
)로지정하십시오。밀도가계산된위치와데이터값간의거리로구성된배열을하나의인수로갖는지정된함수가소프트웨어에의해호출됩니다。함수는커널함수의대응값을포함하는같은크기의배열을반환해야합니다。
'功能'
이'PDF'
이면커널함수가밀도값을반환합니다。그렇지않은경우누적확률값을반환합니다。
'功能'
이'ICDF'
인경우사용자지정커널을지정하면오류가반환됩니다。
이변량데이터에대해ksdensity
는동일한커널을각차원에적용합니다。
예:“核心”,“盒子”
“NumPoints”
-균일한간격으로배치된점의개수西
에균일한간격으로배치된점의개수로,“NumPoints”
와함께스칼라값이쉼표로구분되어지정됩니다。이이름 - 값쌍은일변량데이터에만유효합니다。
예를들어,표본데이터범위내에균일한간격으로배치된80개점에서지정된함수의커널스무딩추정값에대해다음을입력합니다。
예:'为NumPoints',80
데이터형:单
|双
'万博1manbetx支持'
-밀도에대한지지범위“无限”
(디폴트값)|“积极”
|2개요소를가진벡터,[L C]
|2 x2행렬,(L1 L2;U1 U2)
밀도에대한지지범위로,'万博1manbetx支持'
와함께다음중하나가쉼표로구분되어지정됩니다。
값 | 설명 |
---|---|
“无限” |
디폴트값。밀도가실수수직선전체에놓일수있도록합니다。 |
“积极” |
밀도를양의값으로제한합니다。 |
2개요소를가진벡터,[L C] |
밀도지지범위에대해유한한하한과상한을제공합니다。이옵션은일변량표본데이터에만유효합니다。 |
2 x2행렬,(L1 L2;U1 U2) |
밀도지지범위에대해유한한하한과상한을제공합니다。첫번째행은하한을포함하고,두번째행은상한을포함합니다。이옵션은이변량표본데이터에만유효합니다。 |
이변량데이터에대해'万博1manbetx支持'
는[0 -Inf;天道酬勤天道酬勤]
또는[0 L,天道酬勤ù]
로지정된양의변수,비유계변수또는유계변수의조합일수있습니다。
예:“万博1manbetx支持”,“积极”
예:'万博1manbetx支持',[0 10]
데이터형:单
|双
|字符
|字符串
“权重”
-표본데이터의가중치BW
——스무딩윈도우의대역폭스무딩윈도우의대역폭으로,스칼라값으로반환됩니다。
“BoundaryCorrection”
을“日志”
(디폴트값)로지정하고'万博1manbetx支持'
를“积极”
또는벡터[L C]
로지정할경우,ksdensity
는로그변환을사용하여유계데이터를비유계데이터로변환합니다。BW
의값은변환된값의범위에있습니다。
커널분포는확률변수의확률밀도함수(pdf)에대한비모수적표현입니다。모수분포가데이터를올바르게설명할수없거나사용자가데이터분포와관련하여가정을하지않으려는경우커널분포를사용할수있습니다。커널분포는결과로생성되는밀도곡선의매끄러운정도를제어하는스무딩함수와대역폭값으로정의됩니다。
커널밀도추정량은확률변수에대한추정된pdf입니다。x의실수값에대해커널밀도추정량공식은다음과같이주어집니다。
여기서X1, X2, …, Xñ은알수없는분포의임의표본이고,n은표본크기이며, 는커널스무딩함수이고,H는대역폭입니다。
X의실수값에대한누적분포함수(CDF)의커널추정량은다음과같이주어집니다。
여기서 입니다。
자세한내용은内核分配항목을참조하십시오。
반사방법은확률변수가유계지지범위를가질때커널밀도추정량을정확히구하는경계수정방법입니다。“BoundaryCorrection”、“反射”
을지정할경우,ksdensity
는반사방법을사용합니다。이방법은경계근처에반사된데이터를추가하여유계데이터를늘리고pdf를추정합니다。그런다음,ksdensity
는원래지지범위에대한추정된pdf의적분이1이되도록,적절한정규화를통해원래지지범위에대응되는추정된pdf를반환합니다。
“万博1manbetx支持”,[L U]
를추가로지정할경우,ksdensity
는다음과같이커널추정량을구합니다。
'功能'
이'PDF'
일경우커널밀도추정량은다음과같습니다。
大号≤X≤ù에대해 ,
여기서
,
, X一世는一世
번째표본데이터입니다。
'功能'
이“提供”
일경우cdf에대한커널추정량은다음과같습니다。
大号≤X≤ù에대해 。
역cdf,생존함수또는누적위험함수에대한커널추정량을구하기위해('功能'
이'ICDF'
,'幸存者'
또는“cumhazrd”
인경우),ksdensity
는
와
를모두사용합니다。
'万博1manbetx支持'
를“积极”
또는[0正]
로추가로지정할경우,ksdensity
는위의방정식에서[L C]
를[0正]
로바꾸어커널추정량을구합니다。
[1] Bowman, A. W., A. Azzalini。应用平滑技术进行数据分析。纽约:牛津大学出版社,1997年。
[2]山,P.D。“分布函数的核估计”。通讯统计 - 理论与方法。第14卷,第。3,1985年,第605-620。
[3]琼斯,M. C.“核密度估计的简单边界校正”。统计和计算。卷。3,第3期,1993,第135-146。
[4]西尔弗曼,B. W.密度估计统计和数据分析。查普曼和霍尔/ CRC,1986。
이함수는메모리에담을수없는데이터에대한高형배열을지원하지만다음과같은몇가지제한사항이있습니다。
입력데이터에대한추가패스또는정렬을필요로하는일부옵션은지원되지않습니다。
“BoundaryCorrection”
“审查”
'万博1manbetx支持'
(지지범위는항상비유계임)。
(절대편차의중앙값대신)표준편차를사용하여대역폭을계산합니다。
자세한내용은메모리에담을수없는큰데이터를위한高형배열(MATLAB)항목을참조하십시오。
사용법관련참고및제한사항:
플로팅은지원되지않습니다。
이름——값쌍의인수에지정하는이름은컴파일타임상수여야합니다。
“BoundaryCorrection”
,'功能'
,'核心'
이름 - 값쌍의인수의값도컴파일타임상수여야합니다。예를들어,생성되는코드에“函数”、“提供”
이름 - 값쌍의인수를사용하려면codegen
의-args
값에{coder.Constant(函数),coder.Constant (cdf)}
를포함시키십시오。
'核心'
이름 - 값쌍의인수의값은사용자지정함수핸들일수없습니다。사용자지정커널함수를지정하려면문자형벡터또는串형스칼라를사용하십시오。
'万博1manbetx支持'
이름——값쌍의인수값의경우,컴파일타임데이터형과런타임데이터형이일치해야합니다。
아래MATLAB명령에해당하는링크를클릭하셨습니다。
이명령을MATLAB명령창에입력해실행하십시오。웹브라우저에서는MATLAB명령을지원하지않습니다。
你也可以从以下列表中选择一个网站:
选择最佳的网站性能的中国网站(在中国或英文)。其他MathWorks的国家网站都没有从您的位置访问进行了优化。