主要内容

このページの翻訳は最新ではありません。ここをクリックして,英語の最新版を参照してください。

ksdensity

一変量および二変量データのカーネル平滑化関数推定値

説明

f西) = ksdensity (xは,ベクトルまたは2列の行列xに格納されている標本データに対する確率密度推定値fを返します。推定値は正規カーネル関数に基づいており,x内のデータ範囲全体で等間隔となる点西において評価されます。ksdensityは,一変量データの場合は100個の,二変量データの場合は900個の点で密度を推定します。

ksdensityは,連続分布標本で最も適切に機能します。

f西) = ksdensity (xは,fを評価する点()を指定します。この場合,西には同じ値が格納されます。

f西) = ksdensity (___名称,值は,前の構文の入力引数のいずれかに加えて,1つ以上の名前と値のペアの引数によって指定される追加オプションを使用します。たとえば,確率密度関数,累積確率関数,生存時間関数のようなksdensityで評価する関数タイプを定義できます。または平滑化ウィンドウの帯域幅を指定できます。

f西bw) = ksdensity (___は,カーネル平滑化ウィンドウの帯域幅bwも返します。既定の帯域幅は,正規分布の密度に最適です。

ksdensity (___は,カーネル平滑化関数推定をプロットします。

ksdensity (斧头___は,gcaで返される現在の轴ではなく,ハンドル斧头をもつ轴を使用して結果をプロットします。

すべて折りたたむ

2つの正規分布の組み合わせから標本データセットを生成します。

rng (“默认”%的再现性1 x = [randn(30日);5 + randn(30日1)];

推定密度をプロットします。

[f, xi] = ksdensity (x);图绘制(xi, f);

图中包含一个坐标轴。轴包含一个线型对象。

密度推定は,標本の二峰性を示します。

半正規分布から非負の標本データセットを生成します。

rng (“默认”%的再现性pd = makedist (“HalfNormal”“亩”0,“σ”1);x =随机(pd, 100, (1);

名前と値のペアの引数“BoundaryCorrection”を使用して,対数変換および反転という2つの異なる境界補正方法でpdfを推定します。

分= linspace (0, 1000);对估计值进行评估[f1,ξ1]= ksdensity (x,分,“万博1manbetx支持”“积极”);(f2,ξ2))= ksdensity (x,分,“万博1manbetx支持”“积极”“BoundaryCorrection”“反射”);

推定した2つのpdfをプロットします。

Plot (xi1,f1,xi2,f2) LGD = legend(“日志”“反射”);标题(乐金显示器,“边界修正法”) xl = xlim;xlim ([-0.25 xl xl (1) (2)))

图中包含一个坐标轴。轴线包含2个线型对象。这些对象表示日志、反射。

ksdensityは,正または有界のいずれかのサポートが指定された場合に境界補正方法を使用します。既定の境界補正方法は対数変換です。ksdensityは,サポートを元の状態に変換するときに,カーネル密度推定量に1 / x項を導入します。したがって,推定ではx = 0の近くにピークがあります。これに対して反転法では,望ましくないピークが境界の付近に発生することはありません。

標本データを読み込みます。

负载医院

指定された一連の値で評価された推定累積分布関数を計算およびプロットします。

分= (min (hospital.Weight): 2:马克斯(hospital.Weight));图()ecdf (hospital.Weight)(f, xi, bw) = ksdensity(医院。体重、分“万博1manbetx支持”“积极”...“函数”“提供”);情节(xi, f,“g”“线宽”2)传说(“经验提供”“kernel-bw:违约”“位置”“西北”)包含(“病人体重”) ylabel (“估计提供”

图中包含一个坐标轴。轴线包含楼梯型、直线型2个物体。这些对象代表经验的cdf, kernel-bw:default。

ksdensityは,累積分布関数推定の平滑化が過剰であるように見えます。帯域幅を狭くして推定にすると,経験的累積分布関数に近い推定が生成される可能性があります。

平滑化ウィンドウの帯域幅を返します。

bw
bw = 0.1070

より狭い帯域幅を使用して累積分布関数推定をプロットします。

[f, xi] = ksdensity(医院。体重、分“万博1manbetx支持”“积极”...“函数”“提供”“带宽”, 0.05);情节(xi, f,“——r”“线宽”2)传说(“经验提供”“kernel-bw:违约”“kernel-bw: 0.05”...“位置”“西北”)举行

图中包含一个坐标轴。轴线包含楼梯式、直线式3个物体。这些对象代表经验cdf, kernel-bw:default, kernel-bw:0.05。

より小さい帯域幅を使用するksdensity推定は,経験的累積分布関数に一致する確率が高くなります。

標本データを読み込みます。

负载医院

等間隔に配置された50個の点で評価される推定累積分布関数をプロットします。

图()ksdensity(医院。重量,“万博1manbetx支持”“积极”“函数”“提供”...“NumPoints”, 50)包含(“病人体重”) ylabel (“估计提供”

图中包含一个坐标轴。轴包含一个线型对象。

平均値3をもつ指数分布から標本データを生成します。

rng (“默认”%的再现性随机(x =“经验”, 3100, (1);

打ち切りを示す逻辑ベクトルを作成します。ここで10よりも寿命の長い観測値は打ち切られます。

T = 10;岑= (x > T);

推定密度関数を計算およびプロットします。

图ksdensity (x,“万博1manbetx支持”“积极”“审查”岑);

图中包含一个坐标轴。轴包含一个线型对象。

生存時間関数を計算およびプロットします。

图ksdensity (x,“万博1manbetx支持”“积极”“审查”岑,...“函数”“幸存者”);

图中包含一个坐标轴。轴包含一个线型对象。

累積ハザード関数を計算およびプロットします。

图ksdensity (x,“万博1manbetx支持”“积极”“审查”岑,...“函数”“cumhazard”);

图中包含一个坐标轴。轴包含一个线型对象。

2つの正規分布の混合を生成し,推定累積分布逆関数を指定された一連の確率値でプロットします。

rng (“默认”%的再现性1 x = [randn(30日);5 + randn(30日1)];π= linspace (0 . 01, 99);图ksdensity (x,π,“函数”“icdf”);

图中包含一个坐标轴。轴包含一个线型对象。

2つの正規分布の混合を生成します。

rng (“默认”%的再现性1 x = [randn(30日);5 + randn(30日1)];

確率密度推定の平滑化ウィンドウの帯域幅を返します。

(f, xi, bw) = ksdensity (x);bw
bw = 1.5141

既定の帯域幅は,正規分布の密度に最適です。

推定密度をプロットします。

图绘制(xi, f);包含(“十一”) ylabel (“f”)举行

图中包含一个坐标轴。轴包含一个线型对象。

増大した帯域幅値を使用して密度をプロットします。

[f, xi] = ksdensity (x,“带宽”, 1.8);情节(xi, f,“——r”“线宽”, 1.5)

图中包含一个坐标轴。轴线包含2个线型对象。

帯域幅が広がると密度推定がさらに平滑化されるため,分布の一部の特徴が認識されない可能性があります。

次に,減少した帯域幅値を使用して密度をプロットします。

[f, xi] = ksdensity (x,“带宽”, 0.8);情节(xi, f,“同意”“线宽”传说,1.5)(“bw =违约”“bw = 1.8”“bw = 0.8”)举行

图中包含一个坐标轴。轴线包含3个线型对象。这些对象表示bw = default, bw = 1.8, bw = 0.8。

帯域幅が小さくなると密度推定の平滑化は少なくなり,標本のいくつかの特徴が誇張されます。

密度を評価する点が格納されている2列のベクトルを作成します。

gridx1 = -0.25: .05:1.25;gridx2 = 0: .1:15;[x1,x2] = meshgrid(gridx1, gridx2);x1 = x1 (:);x2 = x2 (:);= [x1 x2];

複数の二変量正規分布の混合から取得した乱数が格納されている30行2列の行列を生成します。

rng (“默认”%的再现性X = [0+ 0.5 *rand(20,1) 5+2.5*rand(20,1);综合成绩+ .25 *兰德(10,1)8.75 + 1.25 *兰德(10,1)];

標本データの推定密度をプロットします。

图ksdensity (x, xi);

图中包含一个坐标轴。轴包含一个类型为曲面的对象。

入力引数

すべて折りたたむ

ksdensityfの値を返す対象となる標本データ。列ベクトルまたは2列の行列を指定します。一変量データの場合は列ベクトル、二変量データの場合は 2 列の行列を使用します。

例:[f, xi] = ksdensity (x)

データ型:|

fを評価する点。ベクトルまたは2列の行列を指定します。一変量データの場合、は行ベクトルまたは列ベクトルにすることができます。返される出力fの長さは,内の点の個数と同じです。

例:分= (0:1:25);ksdensity (x,分);

データ型:|

ksdensityのプロット先の图の轴ハンドル。ハンドルとして指定します。

たとえば,hが图のハンドルである場合,ksdensityはその图に次のようにプロットできます。

例:ksdensity (h, x)

名前と値のペアの引数

オプションの名称,值引数のコンマ区切りペアを指定します。的名字は引数名で,价值は対応する値です。的名字は引用符で囲まなければなりません。Name1, Value1,…,的家のように,複数の名前と値のペアの引数を,任意の順番で指定できます。

例:“审查”,岑,“内核”、“三角形”,“NumPoints”,20岁的“函数”,“提供”は,ksdensityが三角カーネル平滑化関数を使用し,データの範囲全体で等間隔に配置された20個の点を評価して累積分布関数の推定を指定し,ベクトルの打ち切り情報を表しています。

カーネル平滑化ウィンドウの帯域幅。xに格納されている点の数の関数です。“带宽”とスカラー値から構成されるコンマ区切りのペアとして指定します。標本データが二変量の場合,带宽を2要素のベクトルにすることもできます。既定の設定は正規分布の密度の推定に最適ですが[1],大きい値を選択してさらに平滑化したり,小さい値を選択して平滑化を少なくすることもできます。

“BoundaryCorrection”として“日志”(既定値)、“万博1manbetx支持”として“积极”またはベクトル(L U)を指定した場合,ksdensityは対数変換を使用して有界のデータを非有界に変換します。“带宽”の値は,変換された値のスケールに対するものになります。

例:“带宽”,0.8

データ型:|

境界補正方法。'“BoundaryCorrection”“と,“日志”または“反射”から構成されるコンマ区切りのペアとして指定します。

説明
“日志”

ksdensityは,次のいずれかの変換によって有界のデータxを非有界に変換します。その後,密度推定の後,元の有界スケールに戻します。

  • 一変量データの場合,“万博1manbetx支持”,“积极”を指定すると,ksdensity日志(x)を適用します。

  • 一変量データの場合,“万博1manbetx支持”,[L U]を指定すると(lUは数値スカラーでありL < U)、ksdensity日志((xl) / (U-x))を適用します。

  • 二変量データの場合,ksdensityは一変量データの場合と同じ方法でxの各列を変換します。

“带宽”の値と出力bwは,変換された値のスケールに対するものになります。

“反射”

ksdensityは,反転データを境界の近くに追加することにより有界データを補充してから,元のサポートに対応する推定値を返します。詳細については,反転法を参照してください。

ksdensityは,“万博1manbetx支持”として“无限”以外の値が指定された場合のみ,境界補正を適用します。

例:“BoundaryCorrection”、“反射”

打ち切るエントリを指定する逻辑ベクトル。“审查”とバイナリ値のベクトルから構成されるコンマ区切りのペアとして指定します。値が0 の場合は打ち切りがないことを示し、1 は観測が打ち切られることを示します。既定の設定では、打ち切りはありません。この名前と値のペアの引数は、一変量データの場合のみ有効です。

例:“审查”,censdata

データ型:逻辑

推定する関数。“函数”と,以下のいずれかで構成されるコンマ区切りペアとして指定します。

説明
“pdf” 確率密度関数。
“提供” 累積分布関数。
“icdf”

累積分布逆関数。ksdensityxの値について推定した累積分布逆関数を計算し,πで指定された確率値で評価します。

この値は一変量データのみについて有効です。

“幸存者” 生存時間関数。
“cumhazard”

累積ハザード関数。

この値は一変量データのみについて有効です。

例:“函数”“icdf”

カーネル平滑化のタイプ。“内核”と,以下のいずれかで構成されるコンマ区切りペアとして指定します。

  • “正常”(既定の設定)

  • “盒子”

  • “三角形”

  • “epanechnikov”

  • カスタム関数または組み込み関数であるカーネル関数。関数ハンドル(@myfunction@normpdfなど)を使用するか,文字ベクトルまたは字符串スカラー(“myfunction”“normpdf”など)を使用して,関数を指定します。指定した関数は1つの引数を使用して呼び出されます。この引数は,密度の評価位置とデータ値の間の距離の配列です。関数は,カーネル関数の対応する値を含む、同じサイズの配列を返さなければなりません。

    “函数”“pdf”である場合,カーネル関数は密度値を返します。それ以外の場合は,累積確率値を返します。

    “函数”値が“icdf”の場合にカスタムカーネルを指定すると,エラーが返されます。

二変量データの場合,ksdensityは同じカーネルを各次元に適用します。

例:“内核”、“盒子”

西内の等間隔に配置された点の数。“NumPoints”とスカラー値で構成されるコンマ区切りのペアとして指定します。この名前と値のペアの引数は,一変量データの場合のみ有効です。

たとえば,標本データの範囲内で等間隔に配置された80個の点で,指定された関数のカーネル平滑化推定値を求めるには,次のように入力します。

例:“NumPoints”,80年

データ型:|

密度のサポート。“万博1manbetx支持”と,以下のいずれかで構成されるコンマ区切りペアとして指定します。

説明
“无限” 既定の設定。密度は,実数直線全体に広がります。
“积极” 密度を正の値に制限します。
2要素ベクトル(L U) 密度をサポートするための下限と上限を指定します。このオプションは,一変量標本データの場合のみ有効です。
2行2列の行列(L1 L2;U1 U2) 密度をサポートするための下限と上限を指定します。1行目には下限が、2 行目には上限が格納されます。このオプションは、二変量標本データの場合のみ有効です。

二変量データの場合,“万博1manbetx支持”には[0负无穷;正正)[0 L;正你)のような正,非有界または有界の変数の組み合わせを指定できます。

例:“万博1manbetx支持”,“积极”

例:“万博1manbetx支持”,[0 10]

データ型:||字符|字符串

カーネル密度プロットの作成に使用する関数。“PlotFcn”と次のいずれかから構成されるコンマ区切りのペアとして指定します。

説明
“冲浪” 冲浪を使用して作成される3次元影付き表面プロット
“轮廓” 轮廓を使用して作成される等高線図
“plot3” plot3を使用して作成される3次元ラインプロット
“surfc” surfcを使用して作成される3次元影付き表面プロットの下の等高線図

この名前と値のペアの引数は,二変量標本データの場合のみ有効です。

例:“PlotFcn”、“轮廓”

標本データの重み。“重量”と長さが大小(x, 1)のベクトルから構成されるコンマ区切りのペアとして指定します。xは標本データです。

例:“重量”,xw

データ型:|

出力引数

すべて折りたたむ

推定される関数値。西または内の点の個数と等しい長さをもつベクトルとして返されます。

ksdensityfを計算する評価点。ベクトルまたは2列の行列として返されます。一変量データの場合、既定の設定はx内のデータ範囲全体で等間隔に配置された100個の点です。二変量データの場合,既定の設定は等間隔に配置された 900 個の点です。これらの点は、meshgridを使用して各次元で等間隔に配置された30個の点から作成されます。

平滑化ウィンドウの帯域幅。スカラー値として返されます。

“BoundaryCorrection”として“日志”(既定値)、“万博1manbetx支持”として“积极”またはベクトル(L U)を指定した場合,ksdensityは対数変換を使用して有界のデータを非有界に変換します。bwの値は,変換された値のスケールに対するものになります。

詳細

すべて折りたたむ

カーネル分布

カーネル分布は,確率変数の確率密度関数(pdf)のノンパラメトリック表現です。パラメトリック分布ではデータを適切に記述できなかったり,データの分布に関する仮定を実行しない場合,カーネル分布を使用できます。カーネル分布は,平滑化関数と帯域幅の値によって定義されます。これらは,生成される密度曲線の滑らかさを制御します。

カーネル密度推定量は,確率変数の推定pdfです。xの任意の実数値について、カーネル密度推定量は次の式によって与えられます。

f h x 1 n h 1 n K x x h

ここでx1, x2,…,…nは未知の分布に由来する無作為標本,nは標本サイズ, K · はカーネル平滑化関数,hは帯域幅です。

xの任意の実数値について,累積分布関数(cdf)のカーネル推定量は次の式によって与えられます。

F h x x f h t d t 1 n 1 n G x x h

ここで, G x x K t d t です。

詳細は,カーネル分布を参照してください。

反転法

反転法は,確率変数に有界のサポートがある場合にカーネル密度推定量を正確に求める境界補正方法です。“BoundaryCorrection”、“反射”が指定された場合,ksdensityは反転法を使用します。この方法では,反転データを境界の近くに追加することにより有界データを補充し,pdfを推定します。そして,ksdensityは,元のサポートに対して推定pdfを積分すると1になるよう適切に正規化された,元のサポートに対応する推定pdfを返します。

さらに“万博1manbetx支持”,[L U]が指定された場合,ksdensityはカーネル推定量を以下のように求めます。

  • “函数”“pdf”である場合,カーネル密度推定量は

    f h x 1 n h 1 n K x x h + K x x h + K x x + h L≤x≤U)。

    ここで, x 2 l x および x + 2 U x でありx番目の標本データです。

  • “函数”“提供”である場合,cdf实验组のカーネル推定量は

    F h x 1 n 1 n G x x h + G x x h + G x x + h 1 n 1 n G l x h + G l x h + G l x + h L≤x≤U)。

  • “函数”“icdf”“幸存者”,または“cumhazrd”である場合に)累積分布逆関数,生存時間関数または累積ハザード関数のカーネル推定量を取得するために,ksdensity f h x F h x の両方を使用します。

さらに“万博1manbetx支持”として“积极”または[0正]が指定された場合,ksdensityは上記の方程式で(L U)[0正]に置き換えることによりカーネル推定量を求めます。

参照

鲍曼,A. W.和阿扎里尼。应用平滑技术进行数据分析。纽约:牛津大学出版社,1997。

[2] Hill, P. D.“分布函数的核估计”。统计通讯-理论和方法。1985年第14卷第3期605-620页。

[3] Jones, M. C. <核密度估计的简单边界校正>。统计和计算。1993年第3卷第3期135-146页。

统计和数据分析的密度估计。查普曼和霍尔/CRC, 1986。

拡張機能

R2006aより前に導入