主要内容

このページの翻訳は最新ではありません。ここをクリックして,英語の最新版を参照してください。

coxphfit

コックス比例ハザード回帰

説明

B=coxphfit(X,T)は、予測子Xに対する、観測された応答Tコックス比例ハザード回帰の係数推定値が格納されている、P行 1.列のベクトルBを返します。Tはn行1列のベクトルまたはn行2列の行列,Xはn行p列の行列です。

このモデルには定数項がありません。また、Xには1で構成される列を含めることはできません。

B=coxphfit(X,T,名称、值)は、1.つまたは複数の名称、值ペア引数で指定された追加オプションで、係数推定値のベクトルを返します。

また、[B,对数,H,统计数据]=coxphfit(___)は、対数尤度对数、追加の統計を含む统计数据構造体、最初の列にT値、2.番目の列に推定ベースライン累積ハザードを含む 2.列の行列Hを返します。前の構文の入力引数のいずれかを使用できます。

すべて折りたたむ

標本データを読み込みます。

装载(“lightbulb.mat”);

電球データの 1.列目には 2.種類の電球の寿命 (時間単位) が含まれています。2.列目には、電球が蛍光灯か白熱灯であるかを示すバイナリ変数が含まれています。0は電球が蛍光灯であることを、1.は白熱灯であることを示します。3.列目には打ち切り情報が含まれます。ここで、0は電球が故障するまで観測されたことを示し、1.は電球が打ち切られたことを示します。

電球の寿命のコックス比例ハザードモデルを近似し,打ち切りも考慮します。予測子変数は電球のタイプです。

b = coxphfit(灯泡(:,2),灯泡(:1),...“审查”,灯泡(:,3))
b = 4.7262

ハザード率の推定値は E B = 112.8646 です。つまり、白熱灯電球のハザードは、蛍光灯電球のハザードの 112.86倍であることを意味します。

標本データを読み込みます。

装载(“lightbulb.mat”);

データの 1.列目には 2.種類の電球の寿命 (時間単位) が含まれています。2.列目には、電球が蛍光灯か白熱灯であるかを示すバイナリ変数が含まれています。1.は電球が蛍光灯であることを、0は白熱灯であることを示します。3.列目には打ち切り情報が含まれます。ここで、0は電球が故障するまで観測されることを示し、1.はアイテム (電球) が打ち切られることを示します。

コックス比例ハザード モデルを近似し、打ち切りも考慮します。予測子変数は電球のタイプです。

b = coxphfit(灯泡(:,2),灯泡(:1),...“审查”,灯泡(:,3))
b = 4.7262

coxphfitで係数の推定に使用するアルゴリズムの既定の制御パラメーターを表示します。

statset (“coxphfit”)
ans=带字段的结构:Display: 'off' MaxFunEvals: 200 MaxIter: 100 TolBnd: 1.0000e-06 TolFun: 1.0000e-08 TolTypeFun: [] TolX: 1.0000e-08 TolTypeX: [] GradObj: [] Jacobian: [] derivative: [] FunValCheck: [] Robust: [] RobustWgtFun: [] WgtFun: [] Tune: [] UseParallel: [] UseSubstreams: [] Streams: {} OutputFcn: []

オプションを異なる名前で保存し,結果の表示方法と最大反復回数(显示および麦克斯特) を変更します。

coxphopt = statset (“coxphfit”);coxphopt。显示=“最后一次”;coxphopt。麦克斯特=50;

新しいアルゴリズムパラメーターを使用してcoxphfitを実行します。

b = coxphfit(灯泡(:,2),灯泡(:1),...“审查”,灯泡(:,3),“选项”,coxphopt)
成功收敛:梯度范数小于OPTIONS。TolFun
b = 4.7262

coxphfitは,最後の反復に関するレポートを表示します。最大反復回数を変更しても,係数推定値には影響しません。

予測子Xに依存するワイブルデータを生成します。

rng (“默认”)%为了再现性X=4*rand(100,1);A=50*exp(-0.5*X);B=2;y=wblrnd(A,B);

応答値は、予測子変数Xとスケールパラメーター2によって変化する形状パラメーターをもつワイブル分布から生成されます。

コックス比例ハザード モデルを近似します。

[b, logL H,统计]= coxphfit (X, y);[b logL]
ans=1×20.9409 -331.1479

係数推定値は0.9409で,対数尤度値は-331.1479です。

モデルの統計量を要求します。

统计数据
统计数据=带字段的结构:covb: 0.0158 beta版:0.9409 se: 0.1256 z: 7.4889 p: 6.9462 e-14 csr: x1双[100]devres: x1双[100]martres: x1双[100]薛定:x1双[100]sschres: [100 x1双)得分:x1双[100]sscores: e-16 x1双[100]LikelihoodRatioTestP: 6.6613

係数推定値の共分散行列冠状病毒に含まれる 1.つの値は、この例の係数推定値の分散と等しくなります。係数推定値贝塔Bと同じで、0.9409になります。係数推定値の標準誤差se0.0158は0.1256で分散の平方根になります。 Z 統計量Zは、β/硒= 0.9409/0.1256 = 7.4880 です。P値Pは、Xの効果が有意であることを示します。

ベースライン生存時間関数のコックス推定値を既知のワイブル関数と共にプロットします。

楼梯(H(:,1),exp(-H(:,2)),“线宽”,2)xx=linspace(0100);直线(xx,1-wblcdf(xx,50*exp(-0.5*mean(X)),B),“颜色”,“r”,“线宽”,2)xlim([0,50])图例(“估计幸存者函数”,“威布尔函数幸存者”)

图中包含一个轴。轴包含两个类型为stair、line的对象。这些对象表示估计的幸存者函数、威布尔幸存者函数。

近似モデルによって、実際の分布の生存時間関数に近い推定値が示されます。

入力引数

すべて折りたたむ

予測子変数に関する観測値。N個の観測値のそれぞれについて P個の予測子の N行 P列の行列として指定します。

このモデルには定数項がないため、Xには1で構成される列を含めることはできません。

XT、あるいは“频率”または“地层”の値に値が含まれている場合,coxphfitはコックスモデルをあてはめるときに,値がある行をすべてのデータから削除します。

データ型:

イベントが発生するまでの時間のデータ。N行 1.列のベクトルまたは 2.列の行列を指定します。

  • Tが N行 1.列のベクトルの場合、イベントが発生するまでの時間のデータを右側打ち切りしたイベント時間を表します。

  • Tがn行2列の行列の場合,各行は時間依存共変量のリスク区間(启动、停止)を計数過程形式で表します。1列目は開始時間2列目は停止時間です。たとえば,共変量が時間に依存するコックス比例ハザード モデルを参照してください。

XT、あるいは“频率”または“地层”の値に値が含まれている場合,coxphfitはコックスモデルをあてはめるときに,値がある行をすべてのデータから削除します。

データ型:|

名前と値のペアの引数

オプションの名称、值引数のコンマ区切りペアを指定します。的名字は引数名で、价值は対応する値です。的名字は引用符で囲まなければなりません。Name1, Value1,…,的家のように、複数の名前と値のペアの引数を、任意の順番で指定できます。

例:“基线”,0,“审查”,审查数据,“频率”,频率の指定により,coxphfitでは,ベクトルcensoreddataの打ち切り情報と,ベクトル频率で与えられるTおよびXでの観測の頻度を考慮して,0を基準にしたベースラインハザード率を計算します。

係数の初期値。‘B0’と数値ベクトルから構成されるコンマ区切りの値として指定します。

データ型:

ベースラインハザードの計算対象となるX値。“基线”とスカラー値で構成されるコンマ区切りのペアとして指定します。

既定値は平均值(X)であるため、Xのハザード率はh (t) * exp (X-mean (X)) * b)です。0を基準にしてベースラインを計算するには「0“を入力します。これにより,Xのハザード率はh(t)*exp(X*b)になります。ベースラインを変更しても係数推定値には影響しませんが、ハザード率が変わります。

例:“基线”,0

データ型:

打ち切りのインジケーター。“审查”と、Tと同じサイズの論理値配列で構成されるコンマ区切りのペアで指定します。右側打ち切りの観測値の場合は 1.完全に観測された観測値の場合は 0を使用します。既定の設定では、すべての観測値が完全に観測されます。たとえば、打ち切りデータのコックス比例ハザード モデルを参照してください。

例:“审查”,岑

データ型:必然的

観測値の頻度または重み。“频率”と配列から構成されるコンマ区切りのペアとして指定します。この配列のサイズは、非負のスカラー値が格納されているTのサイズと同じです。この配列には、観測値の頻度に対応する整数値、または観測値の重みに対応する非負値を格納できます。

XT、あるいは“频率”または“地层”の値に値が含まれている場合,coxphfitはコックスモデルをあてはめるときに,値がある行をすべてのデータから削除します。

既定は,XおよびTの各行に対して1です。

例:“频率”,w

データ型:

階層化変数。実数値の行列から構成されるコンマ区切りのペアとして指定します。この行列の行数はTと同じでなければならず、各行は 1.つの観測値に対応しなければなりません。

XT、あるいは“频率”または“地层”の値に値が含まれている場合,coxphfitはコックスモデルをあてはめるときに,値がある行をすべてのデータから削除します。

既定の[]は階層化変数なしです。

例:“地层”,性别

データ型:|

同順位の故障時間の処理方法。“领带”‘‘健康’(‘の方法)または“埃夫隆”(埃夫隆)の方法) のいずれかから構成されるコンマ区切りのペアとして指定します。

例:“关系”,“埃夫隆”

Bを推定するために使用される反復アルゴリズムのアルゴリズム制御パラメーター。“选项”と構造体で構成されるコンマ区切りのペアとして指定します。statsetを呼び出すと,この引数が作成されます。パラメーター名と既定値には,”statset(“coxphfit”)“と入力します。オプションを新しい名前で設定し,その名前を名前と値のペア引数で使用できます。

例:“选项”,statset('coxphfit')

出力引数

すべて折りたたむ

コックス比例ハザード回帰の係数推定値。P行 1 列のベクトルとして返されます。

近似されたモデルの対数尤度。スカラーとして返されます。

対数尤度値を使用してさまざまなモデルを比較し,モデルの項の効果の有意性を評価できます。

Tの値で評価された推定ベースライン累積ハザード率。以下のいずれかとして返されます。

  • モデルが階層化されていない場合、Hは2列の行列です。行列の最初の列にはT値が含まれ2列目には累積ハザード率の推定値が含まれます。

  • モデルが階層化されている場合、Hは (2+k)列の行列です。最後の K列は、名前と値のペアの引数地层を使用した階層化変数に対応します。

係数統計量。以下のフィールドを含む構造体として返されます。

贝塔 係数推定値 (Bと同じ)
se 係数推定値Bの標準誤差
Z Bの Z統計量 (Bを標準誤差で除算したもの)
P Bのp値
冠状病毒

Bに対して推定された共分散行列

企业社会责任

考克斯·斯内尔残差

德夫雷斯 逸脱度残差
马蒂斯 マルチンゲール残差
施雷斯 シェーンフィールド残差
sschres スケーリングされたシェーンフィールド残差
分数 スコア残差
sscores スケーリングされたスコア残差

coxphfitは,Cox-Snell残差,マルチンゲール残差および逸脱度残差を,各行に観測値がある列ベクトルとして返します。シェーンフィールド残差、スケーリングされたシェーンフィールド残差、スコア残差およびスケーリングされたスコア残差は、Xと同じサイズの行列として返されます。打ち切られたデータのシェーンフィールド残差およびスケーリングされたシェーンフィールド残差はになります。

詳細

すべて折りたたむ

コックス比例ハザード回帰

コックス比例ハザード回帰は、生存率の推定値を調整して交絡変数の影響を除去したり、予測子変数の影響を定量化するためのセミパラメトリック手法です。この手法は、注釈変数および交絡変数の影響を一般的なベースライン ハザード関数 H0(t)の乗数として表します。

0に対するベースラインの場合、このモデルは次に対応します。

H ( X , T ) = H 0 ( T ) 经验 [ J = 1. P x J B J ] ,

ここで、 X = ( x 1. , x 2. , , x P ) は 我番目の被験者についての予測子変数、h(X)t, t)は時間におけるXについてのハザード率、H0(t)はベースラインハザード率関数です。ベースラインハザード関数はコックス比例ハザード回帰関数のノンパラメトリック部分ですが,予測子変数の影響は対数線形回帰です。このモデルは,ベースラインハザード関数が時間tに依存しているが,予測子変数は時間に依存していないという仮定に基づいています。階層化および時間依存変数に向けた拡張,同時発生イベント,観測値の重みなどの詳細については,コックス比例ハザードモデルを参照してください。

参照

[1] 《生存数据分析》,伦敦:查普曼与霍尔出版社,1984年。

终身数据的统计模型和方法。霍博肯,新泽西州:威利国际科学出版社,2002年。

[3] 《生存分析》。生物学与健康统计。第二版。斯普林格,2005。

拡張機能

R2006aより前に導入