主要内容

pfamhmmread

从PFAM mmm格式文件读取数据

语法

HMMStruct= pfamhmmread (文件
HMMStruct= pfamhmmread (文件“超时”,TimeOutValue

输入参数

文件

字符向量或字符串,指定文件名、路径和文件名、指向文件的URL或pfam - hmm格式文件的文本。引用的文件是一个PFAM mmm格式的文件。如果您只指定一个文件名,则该文件必须在MATLAB中®搜索路径或在当前文件夹。

提示

您可以使用gethmmprof函数“去整理”属性从PFAM数据库检索HMM配置文件信息,并创建一个PFAM HMM格式的文件。

TimeOutValue 以秒为单位的连接超时,指定为正标量。缺省值是5。详情请参见在这里

输出参数

HMMStruct MATLAB结构,包含来自PFAM hmm格式文件的信息。

描述

请注意

pfamhmmread读取PFAM-HMM格式的文件,从文件格式版本HMMER2.0到HMMER3/f。

HMMStruct= pfamhmmread (文件读取文件,一个PFAM hmm格式的文件,并将其转换为HMMStruct,一个MATLAB结构,包含以下字段,对应HMM配置文件的参数:

描述
的名字 PFAM数据库中HMM配置文件记录的蛋白质族名称(唯一标识符)。
PfamAccessionNumber HMM图谱在PFAM数据库中记录的蛋白家族接入号。
ModelDescription 对HMM配置文件的描述。
ModelLength 配置文件的长度(MATCH状态的数量)。
字母 模型中使用的字母,“AA”“NT”

请注意

AlphaLength是20“AA”4为“NT”

MatchEmission

匹配状态下的符号发射概率。

格式是一个大小矩阵ModelLength——- - - - - -AlphaLength,其中每一行对应特定MATCH状态的发射分布。

InsertEmission

插入状态下的符号发射概率。

格式是一个大小矩阵ModelLength——- - - - - -AlphaLength,其中每一行对应特定INSERT状态的发射分布。

NullEmission

NULL模型的MATCH和INSERT状态下的符号发射概率。

格式是1乘-AlphaLength行向量。

请注意

空概率也称为背景概率。

BeginX

开始状态转移概率。

格式是1乘-(ModelLength + 1)行向量:

[b -> d1 b -> m1 b -> m2 b -> m3 .... .B - >修复)
MatchX

匹配状态转换概率。

格式是4乘-(ModelLength - 1)矩阵:

[m1 -> m2 m2 -> m3…]M [end-1] - >修补;M1-> i1 m2 -> i2…M [end-1] - > [end-1];M1-> d2 m2 -> d3…M [end-1] - > Dend;M1-> e m2 -> e…M [end-1] - > E]
InsertX

插入状态转移概率。

格式是2乘-(ModelLength - 1)矩阵:

[i1 -> m2 i2 -> m3…我[end-1] - >修补;I1->I1 i2 -> i2…我[end-1] - > [end-1]]
DeleteX

删除状态转移概率。

格式是2乘-(ModelLength - 1)矩阵:

[d1 -> m2 d2 -> m3…]D (end-1) - >修补;D1-> d2 d2 -> d3…D (end-1) - > Dend]
FlankingInsertX

用于局部轮廓对齐的侧翼插入状态(N和C)。

格式为2 × 2矩阵:

[n -> b c -> t;N - C N C - > >)
LoopX

用于多次命中对齐的循环状态转换概率。

格式为2 × 2矩阵:

[e -> c j -> b;E - > J J - >)
NullX

空转换概率用于为状态转换提供log-odds值的分数。

格式是一个2乘1的列向量:

F (G - >;G - G >)

HMMStruct= pfamhmmread (文件“超时”,TimeOutValue设置从PFAM数据库检索数据的连接超时时间(以秒为单位)。

有关HMM概要模型的更多信息,请参见HMM Profile模型

例子

读取一个本地保存的PFAM hmm格式文件到MATLAB结构。

pfamhmmread('pf00002.ls') ans = Name: '7tm_2' PfamAccessionNumber: 'PF00002.15' ModelDescription: '7跨膜受体(分泌素家族)' ModelLength: 293 Alphabet: 'AA' MatchEmission: [293x20 double] insertemmission: [293x20 double] NullEmission: [1x20 double] BeginX: [294x1 double] MatchX: [292x4 double] InsertX: [292x2 double] DeleteX: [292x2 double] FlankingInsertX: [2x2 double] LoopX: [2x2 double] NullX: [2x1 double]

版本历史

R2006a之前介绍过