主要内容

gethmmprof

从PFAM数据库中检索隐马尔可夫模型(HMM)轮廓

语法

HMMStruct= gethmmprof (PFAMName
HMMStruct= gethmmprof (PFAMNumber
HMMStruct= gethmmprof(…,去整理,ToFileValue,……)
HMMStruct= gethmmprof(…“模式”,ModeValue,……)
HMMStruct= gethmmprof(…“超时”,TimeOutValue,……)

输入参数

PFAMName 指定PFAM数据库中HMM概要记录的蛋白质族名称(唯一标识符)的字符向量。例如,“7 tm_2”
PFAMNumber 指定PFAM数据库中HMM概要记录的蛋白质族号的整数。例如,2是蛋白质家族的蛋白质家族号吗“PF00002”
ToFileValue 字符向量,指定用于保存数据的文件名或路径和文件名。如果您只指定一个文件名,该文件将保存在MATLAB中®当前文件夹。
ModeValue

指定返回对齐模式的字符向量。的选择是:

  • “ls”——默认。全局对齐模式。

  • “fs”—本地对齐模式。

TimeOutValue 以秒为单位的连接超时,指定为正标量。缺省值是5。详情请参见在这里

输出参数

HMMStruct 包含从PFAM数据库检索的HMM概要信息的MATLAB结构。

描述

请注意

gethmmprof从pmm - hmm配置文件中检索信息,从文件格式版本HMMER2.0到HMMER3/f。

HMMStruct= gethmmprof (PFAMName搜索PFAM数据库(http://pfam.xfam.org/)以获取由PFAMName(一个蛋白质族名),检索HMM概要信息,并将其存储在HMMStruct,一个MATLAB结构,包含以下字段,对应于HMM配置文件的参数。

描述
的名字 PFAM数据库中HMM配置文件记录的蛋白质族名称(唯一标识符)。
PfamAccessionNumber HMM图谱在PFAM数据库中记录的蛋白家族接入号。
ModelDescription 对HMM配置文件的描述。
ModelLength 配置文件的长度(MATCH状态的数量)。
字母 模型中使用的字母,“AA”“NT”

请注意

AlphaLength是20“AA”4为“NT”

MatchEmission

匹配状态下的符号发射概率。

格式是一个大小矩阵ModelLength——- - - - - -AlphaLength,其中每一行对应特定MATCH状态的发射分布。

InsertEmission

插入状态下的符号发射概率。

格式是一个大小矩阵ModelLength——- - - - - -AlphaLength,其中每一行对应特定INSERT状态的发射分布。

NullEmission

NULL模型的MATCH和INSERT状态下的符号发射概率。

格式是1乘-AlphaLength行向量。

请注意

空概率也称为背景概率。

BeginX

开始状态转移概率。

格式是1乘-(ModelLength + 1)行向量:

[b -> d1 b -> m1 b -> m2 b -> m3 .... .B - >修复)
MatchX

匹配状态转换概率。

格式是4乘-(ModelLength - 1)矩阵:

[m1 -> m2 m2 -> m3…]M [end-1] - >修补;M1-> i1 m2 -> i2…M [end-1] - > [end-1];M1-> d2 m2 -> d3…M [end-1] - > Dend;M1-> e m2 -> e…M [end-1] - > E]
InsertX

插入状态转移概率。

格式是2乘-(ModelLength - 1)矩阵:

[i1 -> m2 i2 -> m3…我[end-1] - >修补;I1->I1 i2 -> i2…我[end-1] - > [end-1]]
DeleteX

删除状态转移概率。

格式是2乘-(ModelLength - 1)矩阵:

[d1 -> m2 d2 -> m3…]D (end-1) - >修补;D1-> d2 d2 -> d3…D (end-1) - > Dend]
FlankingInsertX

用于局部轮廓对齐的侧翼插入状态(N和C)。

格式为2 × 2矩阵:

[n -> b c -> t;N - C N C - > >)
LoopX

用于多次命中对齐的循环状态转换概率。

格式为2 × 2矩阵:

[e -> c j -> b;E - > J J - >)
NullX

空转换概率用于为状态转换提供log-odds值的分数。

格式是一个2乘1的列向量:

F (G - >;G - G >)

HMMStruct= gethmmprof (PFAMNumber确定蛋白质家族的接入号PFAMNumber(一个整数),在PFAM数据库中搜索相关记录,检索HMM概要信息,并将其存储在HMMStruct,一个MATLAB结构。

HMMStruct= gethmmprof(…”,PropertyName”,PropertyValue,……)调用gethmmprof使用属性名/属性值对的可选属性。可以以任意顺序指定一个或多个属性。每一个PropertyName必须用单引号括起来,不区分大小写。这些属性名/属性值对如下:

HMMStruct= gethmmprof(…,去整理,ToFileValue,……)将从PFAM数据库返回的数据保存在指定的文件中ToFileValue

请注意

可以将hmm格式的文件读入MATLAB软件pfamhmmread函数。

HMMStruct= gethmmprof(…“模式”,ModeValue,……)指定返回的对齐模式。的选择是:

  • “ls”(默认)—全局对齐模式。

  • “fs”—本地对齐模式。

有关HMM概要模型的更多信息,请参见HMM Profile模型

HMMStruct= gethmmprof(…“超时”,TimeOutValue,……)设置从PFAM数据库检索数据的连接超时时间(以秒为单位)。

例子

要检索分泌素家族中7跨膜受体蛋白的全局排列的隐马尔可夫模型(HMM)剖面,请输入:

嗯= gethmmprof (7 tm_2)嗯=结构体字段:名称:“7 tm_2”PfamAccessionNumber:“PF00002.21”ModelDescription: 7跨膜受体(分泌素家族)的ModelLength: 241字母:“AA”MatchEmission:[241×20双]InsertEmission:[241×20双]NullEmission:[1×20双]BeginX:[242×1双]MatchX:[240×4双]InsertX:[240×2双]DeleteX:[240×2双]FlankingInsertX:[2×2双]LoopX:[2×2双]NullX:(2×1双)

版本历史

R2006a之前介绍过