主要内容

seqconsensus

计算共识序列

语法

CSeq= seqconsensus (seq
CSeq分数= seqconsensus(seq
CSeq= seqconsensus (配置文件
seqconsensus(…”,PropertyName”,PropertyValue,……)
seqconsensus(…”,ScoringMatrix',ScoringMatrixValue

参数

seq 一组多重排列的氨基酸或核苷酸序列。输入字符数组、字符串向量、字符向量的单元格数组或带有该字段的结构数组序列
配置文件 序列剖面。输入函数中的配置文件seqprofile配置文件矩阵的大小[20(或4)x序列长度]每个位置的氨基酸(或核苷酸)的频率或数量。配置文件如果共识中包含缺口,也可以有21(或5)行。
ScoringMatrixValue

下列任何一项:

  • 指定用于对齐的计分矩阵的字符向量或字符串。氨基酸序列选择如下:

    • “BLOSUM62”

    • “BLOSUM30”增加了5“BLOSUM90”

    • “BLOSUM100”

    • “PAM10”增加了10“PAM500”

    • “DAYHOFF”

    • “GONNET”

    默认是:

    • “BLOSUM50”——当AlphabetValue=“AA”

    • “NUC44”——当AlphabetValue=“NT”

    请注意

    软件提供的上述评分矩阵还包括一个包含比例因子的结构,该比例因子将输出评分单位转换为比特。你也可以使用“规模”属性指定一个附加比例因子,以将输出分数从位转换为另一个单位。

  • 一个21 x215 x520 x20,或4 x4数字数组。对于包含差距的情况,差距分数(最后一行/列)设置为意思是(诊断接头(ScoringMatrix))对于与另一个间隙匹配的间隙,并设置为意思是(nodiag (ScoringMatrix))用于与另一个符号匹配的缺口。

    请注意

    如果使用您创建的评分矩阵,则该矩阵不包括比例因子。输出分数将以与评分矩阵相同的单位返回。

请注意

如果需要编译seqconsensus独立应用程序或软件组件使用MATLAB®编译器™,使用矩阵代替字符向量或字符串ScoringMatrixValue

描述

CSeq= seqconsensus (seq,对于多重对齐的序列集(seq),返回具有一致性序列的字符向量(CSeq).符号出现的频率(20.氨基酸,4核苷酸)中的序列是用函数确定的seqprofile.对于不明确的核苷酸或氨基酸符号,频率或计数被添加到标准符号集中。

CSeq分数= seqconsensus(seq返回一致性序列的保守分数。分数由评分矩阵计算BLOSUM50氨基酸或NUC44核苷酸。得分是得分符号和m维共识值之间的平均欧氏距离。是字母的大小。共识值是由评分矩阵加权的剖面。

CSeq= seqconsensus (配置文件返回具有一致性序列(CSeq)从序列概要文件(配置文件).

seqconsensus(…”,PropertyName”,PropertyValue,……)使用属性名/值对定义可选属性。

seqconsensus(…”,ScoringMatrix',ScoringMatrixValue指定评分矩阵。

下面的输入参数类似于函数seqprofile当字母被限制在“AA”“NT”

seqconsensus(…“字母”,AlphabetValue

seqconsensus(…“差距”,GapsValue

seqconsensus(…“模糊”,AmbiguousValue

seqconsensus(…“限制”,LimitsValue

例子

Seqs = fastaread('pf00002.fa');[C, S] = seqconsensus (seq,“限制”,[50 60],“缺口”,“所有”)

版本历史

R2006a之前介绍