大中型企业

最大似然估计

描述

酷毙了= MLE(数据)使用向量中的样本数据,返回正态分布参数的最大似然估计(MLEs)数据

例子

酷毙了= MLE(数据“分布”,DIST)返回参数估计值由指定的分布DIST

例子

酷毙了= MLE(数据, 'PDF',PDF格式“开始”,开始)返回由概率密度函数指定的自定义分布的参数估计PDF格式。您还必须指定初始参数值,开始

例子

酷毙了= MLE(数据, 'PDF',PDF格式“开始”,开始'CDF',提供)返回由概率密度函数指定的自定义分布的参数估计PDF格式和自定义累积分布函数提供

酷毙了= MLE(数据'logpdf',logpdf“开始”,开始)返回参数估计的自定义分配指定由日志概率密度函数logpdf。您还必须指定初始参数值,开始

例子

酷毙了= MLE(数据'logpdf',logpdf“开始”,开始'logsf',logsf)返回参数估计的自定义分配指定由日志概率密度函数logpdf和自定义日志生存函数logsf

例子

酷毙了= MLE(数据'nloglf',nloglf“开始”,开始)返回由负对数似然函数指定的自定义分布的参数估计数nloglf。您还必须指定初始参数值,开始

酷毙了= MLE(___,名称,值)指定使用名称 - 值对的参数除了任何的在前面的语法的输入参数的选项。例如,您可以指定截尾数据,观测频率和置信水平。

例子

(酷毙了,PCI]=标定___)也返回该参数的95%置信区间。

例子

全部收缩

加载样本数据。

加载carbig

的变量英里/加仑有每加仑英里的汽车的不同车型。

绘制的直方图英里/加仑数据。

直方图(MPG)

这个分布有点偏右。对称分布,例如正态分布,可能不是一个很好的拟合。

估计伯尔类型XII分布的参数英里/加仑数据。

柏= MLE(MPG,'分配',“毛刺”)
太好了=1×334.6447 3.7898 3.5722

为尺度参数α的最大似然估计为34.6447。两个形状参数的估计 c k 伯尔类型XII的分布分别为3.7898和3.5722。

生成从与自由度8和noncentrality参数3的非中心卡方分布大小1000的采样数据。

RNG默认%的再现性x = ncx2rnd (8, 1000,1);

从样本数据估计非中心卡方分布的参数。属性自定义非中心卡方格式pdfPDF格式输入参数。

(太好了,pci)大中型企业的(x) =“pdf”,@(X,V,d)ncx2pdf(X,V,d),“开始”[1])
太好了=1×28.1052 - 2.6693
PCI =2×27.1121 1.6025 9.0983 3.7362

对于自由度的估计是8.1052和noncentrality参数为2.6693。对于自由度的95%置信区间是(7.1121,9.0983)和noncentrality参数是(1.6025,3.7362)。置信区间包括的分别为8和3,真正的参数值。

加载样本数据。

加载('readmissiontimes.mat');

数据包括ReadmissionTime该公司有100名患者的再入院时间。列向量截尾为每个患者的检查信息,其中1表示经过检查的观察,0表示观察到的确切再入院时间。这是模拟数据。

定义自定义概率密度和累积分布函数。

custpdf = @(数据,拉姆达)的λ* EXP(-Lambda *数据);custcdf = @(数据,拉姆达)1-EXP(-Lambda *数据);

估计参数,拉姆达的自定义分布的截尾样本数据。

柏= MLE(ReadmissionTime,“pdf”,custpdf,“提供”,custcdf,“开始”,0.05,“审查”,审查)
柏= 0.1096

加载样本数据。

加载('readmissiontimes.mat');

数据包括ReadmissionTime该公司有100名患者的再入院时间。列向量截尾为每个患者的检查信息,其中1表示经过检查的观察,0表示观察到的确切再入院时间。这是模拟数据。

定义一个自定义的对数概率密度和生存函数。

custlogpdf = @(数据、λk)日志(k) - k *日志(λ)+ (k - 1) *日志(数据)-(数据/λ)。^ k;custlogsf = @(data,,k) -(data/).^k;

估计参数,拉姆达k的自定义分布的截尾样本数据。

柏= MLE(ReadmissionTime,“logpdf”,custlogpdf,'logsf'custlogsf,...“开始”,[1,0.75]“审查”,审查)
太好了=1×29.2090 - 1.4223

所述自定义的分布的比例和形状参数分别为9.2090和1.4223。

加载样本数据。

加载('readmissiontimes.mat');

数据包括ReadmissionTime该公司有100名患者的再入院时间。这是模拟数据。

定义一个负对数似然函数。

custnloglf = @(lambda,data,cens,freq) - length(data)*log(lambda) + nansum(lambda*data);

估计已定义分布的参数。

柏= MLE(ReadmissionTime,'nloglf',custnloglf,“开始”,0.05)
太好了= 0.1462

生成二项分布100个随机观察与试验的次数, n = 20,成功的概率, p = 0.75。

数据= binornd(20,0.75,100,1);

使用模拟样本数据估计成功的概率和95%的置信限。

[柏,PCI] = MLE(数据,'分配',“二项式”,“α”, 0。'ntrials',20)
柏= 0.7615
PCI =2×10.7422 0.7800

成功概率的估计为0.7615,95%置信区间的下限和上限分别为0.7422和0.78。此间隔包含用于模拟数据的真实值。

从自由度为10、非中心性参数为5的非中心卡方分布中生成1000的样本数据。

RNG默认%的再现性X = ncx2rnd(10,5,1000,1);

假设非中心性参数固定在值5。从样本数据估计非中心卡方分布的自由度。属性自定义非中心卡方格式pdfPDF格式输入参数。

(太好了,pci)大中型企业的(x) =“pdf”,@(X,V,d)ncx2pdf(X,V,5),“开始”,1)
太好了= 9.9307
PCI =2×19.5626 10.2989

用于noncentrality参数估计是9.9307,与9.5626和10.2989 95%置信区间。置信区间包括的10的真实参数值。

从具有8 noncentrality参数和5.首先创建莱斯分布刻度参数莱斯分布生成大小1000的采样数据。

R = makedist(“莱斯”,“年代”8“西格玛”5);

现在,从上面创建的分布中生成示例数据。

RNG默认%的再现性X =随机(R,1000,1);

假设尺度参数已知,从样本数据中估计非中心性参数。要做到这一点,请使用大中型企业,您必须自定义Rician概率密度函数。

(太好了,pci)大中型企业的(x) =“pdf”@ (x,年代,σ)pdf (“rician”5),x,年代,“开始”,10)
柏= 7.8953
PCI =2×17.5405 8.2501

非中心性参数的估计为7.8953,95%置信区间为7.5404和8.2501。置信区间包含真实参数值8。

在卡方分布中添加一个尺度参数,以适应数据的尺度并拟合。首先,从自由度为5的卡方分布中生成大小为1000的样本数据,并将其按100的倍数缩放。

RNG默认%的再现性x = 100 * chi2rnd (1000 1);

估计自由度和比例因子。方法自定义卡方概率密度函数PDF格式输入参数。密度函数需要一个 1 / 年代 为数据缩放因子 年代

(太好了,pci)大中型企业的(x) =“pdf”@ (x, v, s) chi2pdf / s (x / s, v),“开始”[1200])
太好了=1×25.1079 - 99.1681
PCI =2×24.6862 90.1215 5.5297 108.2146

自由度的估计是5.1079,尺度是99.1681。自由度的95%置信区间为(4.6862,5.5279),尺度参数为(90.1215,108.2146)。置信区间包括真实参数值分别为5和100。

输入参数

全部收缩

样本数据大中型企业用于估计指定为矢量的分布参数。

数据类型:|

要估计的参数的分布类型,指定为以下类型之一。

DIST 描述 参数1 参数2 参数3 参数4
“伯努利” 伯努利分布 p:成功的概率为每个试验 - - - - - - - - - - - - - - - - - -
“测试版” 贝塔分布 一个:第一形状参数 b:第二形状参数 - - - - - - - - - - - -
'BINO'要么“二” 二项分布 n:试验次数 p:成功的概率为每个试验 - - - - - - - - - - - -
“BirnbaumSaunders” 伯恩鲍姆 - 桑德斯分布 β:尺度参数 γ:形状参数 - - - - - - - - - - - -
“毛刺” 十二型分布 α:尺度参数 c:第一形状参数 k:第二形状参数 - - - - - -
离散均匀的要么“unid” 均匀分布(离散) n:最大可观测值 - - - - - - - - - - - - - - - - - -
“经验”要么“指数” 指数分布 μ:是指 - - - - - - - - - - - - - - - - - -
“电动汽车”要么'极值' 极端值分布 μ:位置参数 σ:尺度参数 - - - - - - - - - - - -
'GAM'要么“伽马” Gamma分布 一个:形状参数 b:尺度参数 - - - - - - - - - - - -
“绿家园”要么“广义极值” 广义极值分布 k:形状参数 σ:尺度参数 μ:位置参数 - - - - - -
“全科医生”要么广义帕累托的 广义帕累托分布 k:尾部指数(形状)参数 σ:尺度参数 θ:阈值(位置)参数 - - - - - -
“地缘”要么'几何' 几何分布 p:概率参数 - - - - - - - - - - - - - - - - - -
'HN'要么“半正常” Half-Normal分布 μ:位置参数 σ:尺度参数 - - - - - - - - - - - -
“InverseGaussian” 逆高斯分布 μ:尺度参数 λ:形状参数 - - - - - - - - - - - -
“物流” 物流配送 μ:是指 σ:尺度参数 - - - - - - - - - - - -
“LogLogistic” Loglogistic分布 μ:对数值的平均值 σ:对数值的尺度参数 - - - - - - - - - - - -
“logn”要么对数正态的 对数正态分布 μ:对数值的平均值 σ:对数值的标准偏差 - - - - - - - - - - - -
“中上” Nakagami分布 μ:形状参数 ω:尺度参数 - - - - - - - - - - - -
'nbin'要么“负二项” 负二项分布 r:成功次数 p:一次试验成功的概率 - - - - - - - - - - - -
'规范'要么'正常' 正态分布 μ:是指 σ:标准偏差 - - - - - - - - - - - -
'poiss'要么“泊松” 泊松分布 λ:是指 - - - - - - - - - - - - - - - - - -
“瑞利”要么“瑞利” 瑞利分布 b:尺度参数 - - - - - - - - - - - - - - - - - -
“莱斯” 莱斯分布 年代:非中心参数 σ:尺度参数 - - - - - - - - - - - -
“稳定” 稳定分布 α:第一形状参数 β:第二形状参数 γ:尺度参数 δ:位置参数
'tLocationScale' t Location-Scale分布 μ:位置参数 σ:尺度参数 ν:形状参数 - - - - - -
“unif”要么'制服' 均匀分布(连续) 一个:下端点(最小) b:上端点(最大) - - - - - - - - - - - -
“wbl”要么“威布尔” 威布尔分布 一个:尺度参数 b:形状参数 - - - - - - - - - - - -

例子:“rician”

自定义概率分布函数,作为一个函数使用手柄创建指定@

这个自定义函数接受向量数据和一个或多个单独的分布参数作为输入参数,并返回概率密度值的向量。

例如,如果自定义概率密度函数的名称是newpdf,然后可以在中指定函数句柄大中型企业如下。

例子:@newpdf

数据类型:function_handle

自定义累积分布函数,作为一个函数使用手柄创建指定@

这个自定义函数接受向量数据和一个或多个单独的分布参数作为输入参数,并返回一个累积概率值的向量。

您必须定义提供PDF格式如果数据审查和使用“审查”名称 - 值对的参数。如果“审查”是不是不在场,你不用指定吗提供同时使用PDF格式

例如,如果自定义累积分布函数的名称是newcdf,然后可以在中指定函数句柄大中型企业如下。

例子:@newcdf

数据类型:function_handle

自定义日志概率密度函数,指定使用函数创建句柄@

这个自定义函数接受向量数据和一个或多个单独的分布参数作为输入参数,并返回一个对数概率值的向量。

例如,如果自定义日志概率密度函数的名称是customlogpdf,然后可以在中指定函数句柄大中型企业如下。

例子:@customlogpdf

数据类型:function_handle

自定义日志生存函数,指定为使用的功能句柄创建@

这个自定义函数接受向量数据和一个或多个单独的分布参数作为输入参数,并返回一个log生存概率值的向量。

您必须定义logsflogpdf如果数据审查和使用“审查”名称 - 值对的参数。如果“审查”是不是不在场,你不用指定吗logsf同时使用logpdf

例如,如果自定义日志生存函数的名称为logsurvival,然后可以在中指定函数句柄大中型企业如下。

例子:@logsurvival

数据类型:function_handle

定制负对数似然函数,指定为功能手柄使用创建@

这个自定义函数接受下面的输入参数。

PARAMS 分布参数值的向量。大中型企业检测从元素的数目的参数的数量开始
数据 矢量数据。
CENS 截尾值的布尔矢量。
频率 整数数据频率的向量。

nloglf必须接受所有四个论点,即使你不使用“审查”要么'频率'名称-值对参数。你可以写'nloglf'忽略CENS频率参数在这种情况下。

nloglf返回一个标量的负对数似然值和一个可选的负对数似然梯度向量(请参阅'GradObj'在现场“选项”)。

如果名称自定义为负对数似然函数negloglik,然后可以在中指定函数句柄大中型企业如下。

例子:@negloglik

数据类型:function_handle

自定义函数的初始参数值,指定为标量值或标量值的向量。

开始当你适合的定制分布,也就是说,当你使用PDF格式提供,logpdflogsf, 要么nloglf输入参数。

例子:0.05

例子:(100 2)

数据类型:|

名称 - 值对参数

指定可选的用逗号分隔的对名称,值参数。名称是参数的名称和是对应的值。名称必须出现引号内。您可以按照任何顺序指定多个名称和值对参数Name1, Value1,…,的家

例子:“审查”,岑,“阿尔法”,0.01,“选项”,选择指定大中型企业估计参数为截尾数据的由阵列中指定的分配CENS,计算参数估计的99%置信限,并使用由结构指定的算法控制参数选择

截尾指示器,指定为逗号分隔对所组成的“审查”和大小相同的布尔数组数据。使用1表示正确审查的观察,使用0表示完全观察的观察。默认情况是所有的观察都被完全观察。

例如,如果该截尾数据信息是二进制阵列中称为截尾,那么你可以按如下方式指定截尾数据。

例子:“截尾”,审查

大中型企业万博1manbetx支持审查以下分布:

Birnbaum-Saunders
伯尔
指数
极值
γ
逆高斯
核心
Log-Logistic
物流
对数正态
Nakagami
正常
Rician
t Location-Scale
威布尔

数据类型:逻辑

观测频率,指定为逗号分隔对所组成'频率'和含非负整数的计数的阵列,其是大小相同的数据。的默认值是每个元素一个观察数据

例如,如果观测频率存储在数组中命名频率,您可以按如下方式指定的频率。

例子:“频率”,频率

数据类型:|

参数估计置信区间的显著性水平,PCI,指定为逗号分隔的一对组成的'Α'和范围(0,1)内的标量值。的置信水平PCI100(1α)%。默认值是0.05有95%的信心。

例如,对于99%置信区间,你可以按如下方式指定的置信水平。

例子:'阿尔法',0.01

数据类型:|

的对应元素的试验次数数据,指定为逗号分隔的一对组成的'Ntrials'和大小相同的标量或向量数据

仅适用于二项分布。

例子:“Ntrials”,

数据类型:|

位置参数为半正态分布,指定为逗号分隔对所组成'亩'和标量值。

仅适用于半正态分布。

例子:'亩',1

数据类型:|

拟合算法的控制参数,指定为逗号分隔的一对组成的“选项”和结构通过返回statset

不适用于所有发行版。

使用“选项”名称 - 值对参数拟合自定义分布时最大似然优化的控制的细节。对于参数名称和默认值,类型statset(“mlecustom”)。您可以设置选项以新的名称和使用的名称 - 值对参数。大中型企业解释以下statset参数自定义分布拟合。

参数
'GradObj'

默认值是“关闭”

'上'要么“关闭”,表示是否fmincon?提供的自定义功能nloglf输入参数返回负对数似然的梯度向量作为第二个输出。

大中型企业忽略了'GradObj'当使用fminsearch

“DerivStep”

默认值是EPS ^(1/3)

的相对差,指定为一个标量或向量的大小相同开始当使用在有限差分衍生物近似值,使用fmincon'GradObj'“关闭”

大中型企业忽略了“DerivStep”当使用fminsearch

'FunValCheck'

默认值是'上'

'上'要么“关闭”,表示是否大中型企业应查核有效性自定义分布函数的返回值。

起点的选择不当有时会导致这些函数返回为NaN如果没有进行适当的错误检查,则可以使用s、无限值或超出范围的值。

'TolBnd'

默认值是1 e-6

当使用一种用于下限和上限偏移fmincon

大中型企业对待降低和上限为严格不等式,即,开放边界。同fmincon,这可以通过从指定的下界和上界创建闭合边界来近似TolBnd

例子:“选项”,statset(“mlecustom”)

数据类型:结构

分布参数的下界,指定为逗号分隔对所组成的“下界”和向量的大小相同开始

属性时,此名称-值对参数才有效PDF格式提供,logpdflogcdf, 要么nloglf输入参数。

例子:下界,0

数据类型:|

分布参数的上界,指定为逗号分隔的对,由“Upperbound”和向量的大小相同开始

属性时,此名称-值对参数才有效PDF格式提供,logpdflogsf, 要么nloglf输入参数。

例子:'UPPERBOUND',1

数据类型:|

优化功能大中型企业在最大化的可能性的用途,被指定为逗号分隔的一对组成的'Optimfun',要么'fminsearch'要么“fmincon”

默认值是'fminsearch'

您只能指定“fmincon”如果优化工具箱™是可用的。

'Optimfun'名称-值对参数仅在适合自定义发行版时有效,即在使用PDF格式提供,logpdflogsf, 要么nloglf输入参数。

例子:“Optimfun”、“fmincon”

输出参数

全部收缩

参数估计,以标量值或行向量的形式返回。

置信区间参数估计,返回作为列向量或取决于参数的数量的矩阵,因此的尺寸酷毙了

PCI是一个2 -k矩阵,k参数的数量大中型企业估计。的所述第一和第二行PCI分别显示置信下限和置信上限。

更多关于

全部收缩

生存函数

生存函数的生存时间的函数的概率。它也被称为幸存者功能。它给出了一个人的存活时间超过一定值的概率。由于累积分布函数,F(t),为生存时间小于或等于给定时间点的概率,为连续分布的生存函数,年代(t),为累积分布函数的补充:年代(t) = 1 -F(t)。

提示

当你提供分配函数时,大中型企业计算使用迭代最大化算法的参数估计。对于某些模型和数据,起点选择不当可能导致大中型企业收敛到不是全局最大化器的局部最优值,或者不能完全收敛。即使对数似然值在全局最大值附近表现良好,起始点的选择往往对算法的收敛性至关重要。特别地,如果初始参数值远离MLEs,分布函数中的欠流可能导致对数概率无穷大。

R2006a前推出