主要内容

seqprofile

Calculate sequence profile from set of multiply aligned sequences

句法

轮廓= seqprofile(seqs
[[轮廓,,,,符号] = seqprofile(seqs
seqprofile(seqs, ...'字母',字母值,...))
seqprofile(seqs,...'Counts',countsvalue,...))
seqprofile(seqs,...“差距”,GapsValue,...))
seqprofile(seqs, ...'模糊的',模棱两可的价值,...))
seqprofile(seqs,...“限制”,LimitsValue,...))

参数

seqs

由以下任何一个表示的乘以对齐序列集:

  • 字符阵列

  • Cell array of character vectors

  • String vector

  • 包含该场的结构阵列Sequence

字母值

字符向量或字符串指定序列字母。选择是:

  • 'nt'- 核苷酸

  • 'aa'- 氨基酸(默认)

  • '没有任何'- 没有字母

什么时候字母'没有任何',符号列表基于观察到的符号。每个字符都可以是任何符号,除了连字符( - )和一个(。)的符号,这些符号是为间隙保留的。

countsvalue

控制返回频率(计数/总数的比率)或计数。选择是true(计数)或错误的(频率)。默认为错误的

GapsValue

控制序列中间隙计数的字符向量或字符串。选择是:

  • '全部'- 计算所有差距

  • 'noflanks'- 计算所有差距except those at the flanks of every sequence

  • '没有任何'- 默认。没有差距。

模棱两可的价值

Controls counting ambiguous symbols. Enter'数数'将部分计数添加到标准符号中。

LimitsValue

指定是否使用序列的一部分。进入一个[1x2]矢量具有第一个位置,也是要包括在轮廓中的最后位置。默认为[1,seqlength]

描述

轮廓= seqprofile(seqs返回轮廓,,,,a matrix of size[20(或4)x序列长度]多重比对中每一列的氨基酸(或核苷酸)的频率。行的顺序由

  • 4 nucleotides —c g t/u

  • 20个氨基酸 -a r n d c q e g h i l k m f p p s t w y v

[[轮廓,,,,符号] = seqprofile(seqs返回符号,,,,a unique symbol list where every symbol in the list corresponds to a row in轮廓,个人资料。

seqprofile(seqs,...'属性名称',,适当的价值,...))呼叫seqprofile使用可选的属性,可使用属性名称/属性值对。您可以按任何顺序指定一个或多个属性。每个属性名称必须以单引号标记封闭,并且不敏感。这些属性名称/属性值对如下:

seqprofile(seqs, ...'字母',字母值,...))选择核苷酸字母,氨基酸字母或无字母。

seqprofile(seqs,...'Counts',countsvalue,...))什么时候Countstrue,返回计数而不是频率。

seqprofile(seqs,...“差距”,GapsValue,...))将一行附加到配置文件的底部(轮廓)有空白的计数。

seqprofile(seqs, ...'模糊的',模棱两可的价值,...))什么时候模糊的'数数',计算模棱两可的氨基酸符号(B Z X)和核苷酸符号(R Y K M S W B D H V N)带有标准符号。例如,氨基酸X添加1/20在氨基酸时计数到每一行b算作1/2dandn行。

seqprofile(seqs,...“限制”,LimitsValue,...))指定轮廓相对于多个对齐索引的开始和终点位置。

例子

全部收缩

创建一系列代表氨基酸多重比对的结构:

seqs = fastaread('pf00002.fa');

从位置55到55个乘以对齐序列的位置55返回序列配置文件和符号列表,计算所有差距。

[profile2,符号2] = seqprofile(seqs,“极限”,,,,[[50 55],'gaps',,,,'全部'
profile2 =21×60.0312 0.0312 0.1562 0.4375 0.1250 0.2188 0 0 0.3750 0 0 0 0 0 0.0938 0.1562 0 0 0 0 0 0.0312 0 0 0 0.0625 0 0 0.0312 0 0 0 0 0.0312 0 0 0 0 0 0.1250 0 0 0.0312 0 0.0625 0 0 0 0 0 0 0 0 0 0.4688 0.0625 0 0 0.3125 0.1562 ⋮
符号2 ='arndcqeghilkmfpstwyv-'

版本历史记录

Introduced before R2006a