gethmmprof
从PFAM数据库中检索隐马尔可夫模型(HMM)轮廓
语法
HMMStruct
= gethmmprof (PFAMName
)HMMStruct
= gethmmprof (PFAMNumber
)HMMStruct
= gethmmprof(…,去整理,ToFileValue
,……)HMMStruct
= gethmmprof(…“模式”,ModeValue
,……)HMMStruct
= gethmmprof(…“超时”,TimeOutValue
,……)
输入参数
PFAMName |
指定PFAM数据库中HMM概要记录的蛋白质族名称(唯一标识符)的字符向量。例如,“7 tm_2” . |
PFAMNumber |
指定PFAM数据库中HMM概要记录的蛋白质族号的整数。例如,2 是蛋白质家族的蛋白质家族号吗“PF00002” . |
ToFileValue |
字符向量,指定用于保存数据的文件名或路径和文件名。如果您只指定一个文件名,该文件将保存在MATLAB中®当前文件夹。 |
ModeValue |
指定返回对齐模式的字符向量。的选择是:
|
TimeOutValue |
以秒为单位的连接超时,指定为正标量。缺省值是5。详情请参见在这里. |
输出参数
HMMStruct |
包含从PFAM数据库检索的HMM概要信息的MATLAB结构。 |
描述
请注意
gethmmprof
从pmm - hmm配置文件中检索信息,从文件格式版本HMMER2.0到HMMER3/f。
搜索PFAM数据库(http://pfam.xfam.org/)以获取由HMMStruct
= gethmmprof (PFAMName
)PFAMName
(一个蛋白质族名),检索HMM概要信息,并将其存储在HMMStruct
,一个MATLAB结构,包含以下字段,对应于HMM配置文件的参数。
场 | 描述 |
---|---|
的名字 |
PFAM数据库中HMM配置文件记录的蛋白质族名称(唯一标识符)。 |
PfamAccessionNumber |
HMM图谱在PFAM数据库中记录的蛋白家族接入号。 |
ModelDescription |
对HMM配置文件的描述。 |
ModelLength |
配置文件的长度(MATCH状态的数量)。 |
字母 |
模型中使用的字母,“AA” 或“NT” .请注意
|
MatchEmission |
匹配状态下的符号发射概率。 格式是一个大小矩阵 |
InsertEmission |
插入状态下的符号发射概率。 格式是一个大小矩阵 |
NullEmission |
NULL模型的MATCH和INSERT状态下的符号发射概率。 格式是1乘- 请注意 空概率也称为背景概率。 |
BeginX |
开始状态转移概率。 格式是1乘- [b -> d1 b -> m1 b -> m2 b -> m3 .... .B - >修复) |
MatchX |
匹配状态转换概率。 格式是4乘- [m1 -> m2 m2 -> m3…]M [end-1] - >修补;M1-> i1 m2 -> i2…M [end-1] - > [end-1];M1-> d2 m2 -> d3…M [end-1] - > Dend;M1-> e m2 -> e…M [end-1] - > E] |
InsertX |
插入状态转移概率。 格式是2乘- [i1 -> m2 i2 -> m3…我[end-1] - >修补;I1->I1 i2 -> i2…我[end-1] - > [end-1]] |
DeleteX |
删除状态转移概率。 格式是2乘- [d1 -> m2 d2 -> m3…]D (end-1) - >修补;D1-> d2 d2 -> d3…D (end-1) - > Dend] |
FlankingInsertX |
用于局部轮廓对齐的侧翼插入状态(N和C)。 格式为2 × 2矩阵: [n -> b c -> t;N - C N C - > >) |
LoopX |
用于多次命中对齐的循环状态转换概率。 格式为2 × 2矩阵: [e -> c j -> b;E - > J J - >) |
NullX |
空转换概率用于为状态转换提供log-odds值的分数。 格式是一个2乘1的列向量: F (G - >;G - G >) |
确定蛋白质家族的接入号HMMStruct
= gethmmprof (PFAMNumber
)PFAMNumber
(一个整数),在PFAM数据库中搜索相关记录,检索HMM概要信息,并将其存储在HMMStruct
,一个MATLAB结构。
调用HMMStruct
= gethmmprof(…”,PropertyName
”,PropertyValue
,……)gethmmprof
使用属性名/属性值对的可选属性。可以以任意顺序指定一个或多个属性。每一个PropertyName
必须用单引号括起来,不区分大小写。这些属性名/属性值对如下:
将从PFAM数据库返回的数据保存在指定的文件中HMMStruct
= gethmmprof(…,去整理,ToFileValue
,……)ToFileValue
.
请注意
可以将hmm格式的文件读入MATLAB软件pfamhmmread
函数。
指定返回的对齐模式。的选择是:HMMStruct
= gethmmprof(…“模式”,ModeValue
,……)
“ls”
(默认)—全局对齐模式。“fs”
—本地对齐模式。
有关HMM概要模型的更多信息,请参见HMM Profile模型.
设置从PFAM数据库检索数据的连接超时时间(以秒为单位)。HMMStruct
= gethmmprof(…“超时”,TimeOutValue
,……)
例子
要检索分泌素家族中7跨膜受体蛋白的全局排列的隐马尔可夫模型(HMM)剖面,请输入:
嗯= gethmmprof (7 tm_2)嗯=结构体字段:名称:“7 tm_2”PfamAccessionNumber:“PF00002.21”ModelDescription: 7跨膜受体(分泌素家族)的ModelLength: 241字母:“AA”MatchEmission:[241×20双]InsertEmission:[241×20双]NullEmission:[1×20双]BeginX:[242×1双]MatchX:[240×4双]InsertX:[240×2双]DeleteX:[240×2双]FlankingInsertX:[2×2双]LoopX:[2×2双]NullX:(2×1双)
版本历史
R2006a之前介绍过