blastncbi

创建远程NCBI爆炸报告请求ID或链接到NCBI爆炸报告

描述

例子

blastncbi (Seq,程序)发送一个爆炸请求NCBI反对Seq,一个核苷酸或氨基酸序列,使用程序,一个指定的BLAST程序。然后返回一个链接到NCBI爆炸报告。在选择适当的爆炸计划的帮助,访问https://blast.ncbi.nlm.nih.gov/producttable.shtml

例子

= blastncbi (Seq,程序)返回,报告的请求ID。

例子

(,RTOE) = blastncbi (Seq,程序)返回, NCBI BLAST报告的请求ID,以及RTOE,请求执行时间,这是完成搜索所需的估计时间。

例子

___= blastncbi (___,名称,值)使用由一个或多个名称-值对参数以及前面语法中的任何参数指定的其他选项。

例子

全部折叠

对蛋白质序列执行BLAST搜索,并将结果保存到XML文件中。

从蛋白质数据库中获取序列并创建一个MATLAB结构。

S = getpdb (“1文明”);

使用该结构作为BLAST搜索的输入,显著性阈值为1平台以及。第一个输出是请求ID,第二个输出是搜索完成之前的估计时间(以分钟为单位)。

[RID1,死记硬背]= blastncbi(年代,“blastp”,“期望”1平台以及);

从报告中获取搜索结果。您可以将xml格式的报告保存为一个文件,以便脱机访问。使用死记硬背作为检索结果的等待时间。

report1 = getblast (RID1,“WaitTime”死记硬背,“去整理”,“1 civ_report.xml”)
Blast的结果还没有出来。请稍等…report1 = struct with fields: RID: 'R49TJMCF014'算法:'BLASTP 2.6.1+'数据库:'nr' QueryID: 'Query_224139' QueryDefinition: '未命名蛋白产品' Hits:[1×100 struct]参数:[1×1 struct]统计:[1×1 struct]

使用blastread从xml格式的BLAST报告文件中读取BLAST数据。

blastdata = blastread (“1 civ_report.xml”)
QueryID: 'Query_224139' QueryDefinition: '未命名蛋白产品' Hits:[1×100 struct]参数:[1×1 struct]统计:[1×1 struct]

或者,使用NCBI登录号运行BLAST搜索。

RID2 = blastncbi (“AAA59174”,“blastp”,“期望”1、平台以及)
RID2 = ' R49WAPMH014 '

从报告中获取搜索结果。

report2 = getblast (RID2)
Blast的结果还没有出来。请稍等…report2 = struct with fields: RID: 'R49WAPMH014'算法:'BLASTP 2.6.1+'数据库:'nr' QueryID: 'AAA59174.1' QueryDefinition: '胰岛素受体前体[人类]' Hits:[1×100 struct]参数:[1×1 struct]统计:[1×1 struct]

输入参数

全部折叠

指定为字符向量、字符串或MATLAB结构的核苷酸或氨基酸序列序列字段。

如果Seq是字符向量或字符串,可用选项有:

  • 基因库®、GenPept或RefSeq登录号

  • FASTA文件的名称

  • 指向序列文件的URL

BLAST程序,指定为下列程序之一:

  • “blastn”-搜索核苷酸查询与核苷酸数据库。

  • “blastp”-搜索蛋白质查询与蛋白质数据库。

  • “blastx”-搜索(翻译)核苷酸查询与蛋白质数据库。

  • “megablast”-寻找高度相似的核苷酸序列。

  • “tblastn”-搜索蛋白质查询与翻译核苷酸数据库。

  • “tblastx”-搜索(翻译)核苷酸查询与(翻译)核苷酸数据库。

名称-值对的观点

的可选逗号分隔对名称,值参数。的名字参数名称和价值为对应值。的名字必须出现在引号内。可以按任意顺序指定多个名称和值对参数Name1, Value1,…,的家

例子:“矩阵”、“PAM70”,“期望”,1平台以及使用PAM70替换矩阵,匹配的显著性阈值设置为1e-10。

要搜索的数据库,指定为逗号分隔对组成的“数据库”和字符向量或字符串。

对于核苷酸数据库,有效的选择是:

  • nr的(默认)

  • “refseq_rna”

  • “refseq_genomic”

  • est

  • “est_human”

  • “est_mouse”

  • “est_others”

  • “gss”

  • 高温凝胶的

  • “拍”

  • pdb的

  • “铝合金”

  • “dbsts”

  • “染色体”

对于蛋白质数据库,有效的选择是:

  • nr的(默认)

  • “refseq_protein”

  • “swissprot”

  • “拍”

  • pdb的

  • “env_nr”

请注意

可用的数据库可能会改变。检查NCBI网站为更多的信息。

为了帮助选择一个适当的数据库,访问

返回的最大命中次数,指定为逗号分隔的对“MaxNumberSequences”一个正整数。实际搜索结果的命中次数可能比您指定的要少,这取决于查询、数据库、期望值和其他参数。默认值为One hundred.

筛选器应用于查询序列,指定为逗号分隔的对,由“过滤”和下列之一:

  • “L”-低成分复杂性的掩模区域。

  • “R”-屏蔽人类重复元素(有效的blastnmegablast只有)。

  • “米”-在产生爆炸种子时屏蔽查询,但不在扩展期间。

  • “没有”-不敷面膜。

  • “l”-屏蔽查询中的任何小写字母。

您可以在单个字符向量或字符串中指定多个有效字母,以同时应用多个筛选器。例如,“Lm”同时应用低合成复杂度的滤镜和蒙版。

选择取决于所选的内容程序。有关更多信息,请参见表可选属性的选择由BLAST程序

与数据库序列匹配的统计显著性阈值,指定为逗号分隔的对,由“期望”一个正的实数。默认值是10

有关局部序列比较的统计信息,请访问https://blast.ncbi.nlm.nih.gov/tutorial/Altschul-1.html#head2

查询序列的字长,指定为逗号分隔的对,由“词”一个正整数。

蛋白质查询搜索的选择有:

  • 2

  • 3.(默认)

核苷酸查询搜索的选择有:

  • 7

  • 11(默认)

  • 15

选择的时候程序被设置为“megablast”是:

  • 16

  • 20.

  • 24

  • 28(默认)

  • 32

  • 48

  • 64

  • 128

置换矩阵为氨基酸序列,指定为逗号分隔的对所组成“矩阵”和字符向量或字符串。矩阵为任意两个氨基酸残基的可能对齐分配分数。的选择是:

  • “PAM30”

  • “PAM70”

  • “BLOSUM45”

  • “BLOSUM62”(默认)

  • “BLOSUM80”

核苷酸比对中的匹配和不匹配分数,指定为逗号分隔的一对“MatchScores”和一个两元素的数值向量(R, Q)。第一个元素R匹配分数和第二个元素是什么为失配得分。此选项用于blastnmegablast只有。

为了保证对对准意义的准确评估,只支持有限的组合。万博1manbetx看到表爆炸可选属性所有支持的值。万博1manbetx的默认值megablast(1 2)的默认值blastn3 [1]

打开和扩展间隙的惩罚,指定为逗号分隔的对,由“GapCosts”和一个两元素的数值向量。这个向量包含两个整数:第一个是打开间隙的惩罚,第二个是扩展间隙的惩罚。

有效缺口成本blastp,blastx,tblastn,tblastx根据蛋白质替代基质的不同而有所不同。有关详细信息,请参见blastp, blastx, tblastn,和tblastx的差距

有效缺口成本blastnmegablast根据不同MatchScores((R, Q))。有关详细信息,请参见伯恩和兆宝的差距

补偿被比较序列的氨基酸组成的成分调整类型,指定为逗号分隔的对,由“CompositionAdjustment”和下列价值观之一:

  • “没有”-没有调整应用(默认)。

  • “哥伦比亚广播公司”-基于作文的统计方法用于分数调整。

  • “实验”-条件合成分数矩阵用于分数调整。

  • “ucsm”-通用合成分数矩阵用于分数调整。

此选项用于blastp,blastx,tblastn只有。得到的标度分数比标准的未标度分数产生更准确的e值。有关详细信息,请参见成分的调整

用于搜索所选数据库子集的Entrez查询语法,指定为逗号分隔的对,由“可以”和字符向量或字符串。使用此选项可以根据分子类型、序列长度、生物体等限制搜索。有关限制搜索的更多信息,请参见https://blast.ncbi.nlm.nih.gov/blastcgihelp.shtml#entrez_query

高级选项,指定为逗号分隔的对,由“阿”和字符向量或字符串。例如,要指定核苷酸匹配和不匹配的奖励和惩罚值,可以使用'- r1 -q -3'。有关更多信息,请参见https://www.ncbi.nlm.nih.gov/blast/Doc/urlapi.html

输出参数

全部折叠

NCBI BLAST报告的请求ID,作为字符向量返回。

请求执行时间,以整数形式返回。这是搜索完成之前的估计时间,以分钟为单位。

提示

如果你使用getblast函数检索爆炸报告,使用此时间估计作为“WaitTime”选择。

更多关于

全部折叠

爆炸可选属性

可选属性的选择由BLAST程序

当爆炸程序是… 那么以下选项的选择是…
数据库 过滤器 矩阵 MatchScores(R, Q) GapCosts
“blastn” nr的(默认)
“refseq_rna”
“refseq_genomic”est
“est_human”
“est_mouse”
“est_others”
“gss”
高温凝胶的
“拍”
pdb的
“铝合金”
“dbsts”
“染色体”
“Lm”(默认)
“R”
“米”
“l”
“没有”
7
11(默认)
15
- - - - - - 3 [1](默认)
(1 - 4)
(1 2)
[1]
3 [2]
5 [4]
看到伯恩和兆宝的差距
“megablast” 16
20.
24
28(默认)
32
48
64
128
3 [1]
(1 - 4)
(1 2)(默认)
[1]
3 [2]
5 [4]
“tblastn” “L”(默认)
“米”
“l”
“没有”
2
3.(默认)
“PAM30”
“PAM70”
“BLOSUM45”
“BLOSUM62”(默认)
“BLOSUM80”
- - - - - - 看到blastp, blastx, tblastn,和tblastx的差距
“tblastx”
“blastp” nr的(默认)
“refseq_protein”
“swissprot”
“拍”
pdb的
“env_nr”
“L”
“米”
“l”
“没有”(默认)
“blastx” “L”(默认)
“米”
“l”
“没有”

GapCosts为blastp,blastx,tblastn,tblastx

替换矩阵 有效的“GapCosts”
“PAM30” (7 - 2)
(6 - 2)
(5 - 2)
(10 - 1)
(9 - 1)(默认)
8 [1]
“PAM70” 8 [2]
(7 - 2)
(6 - 2)
(11 - 1)
(10 - 1)(默认)
(9 - 1)
“BLOSUM80”
“BLOSUM45” [13 3]
[12 3]
[11 3]
3 [10]
[15 2](默认)
(14 - 2)
(13 - 2)
(12 - 2)
(19 (1)
[18 1]
(17 - 1)
[16 1]
“BLOSUM62” (9 - 2)
8 [2]
(7 - 2)
(12 - 1)
(11 - 1)(默认)
(10 - 1)

GapCosts为blastnmegablast

MatchScores (R, Q) 有效的“GapCosts”
(1 - 4) (5 - 2)(默认)
(1 2)
(0 - 2)
(2 - 1)
[1]
3 [1] (5 - 2)(默认)
(2 - 2)
(1 2)
(0 - 2)
(2 - 1)
[1]
(1 2) (5 - 2)(默认)
(2 - 2)
(1 2)
(0 - 2)
(3 - 1)
(2 - 1)
[1]
[1] (5 - 2)(默认)
(3 - 2)
(2 - 2)
(1 2)
(0 - 2)
(4 - 1)
(3 - 1)
(2 - 1)
3 [2] (5 - 2)(默认)
(4 - 4)
(2 - 4)
[0 4]
[3 3]
(6 - 2)
(4 - 2)
(2 - 2)
5 [4] (5 - 2)(默认)
(6 - 5)
5 [5]
5 [4]
[3 - 5]

兼容性的考虑

全部展开

从R2017b开始的错误

从R2017b开始的错误

从R2017b开始的错误

从R2017b开始的错误

从R2017b开始的错误

从R2017b开始的错误

从R2017b开始的错误

参考文献

李普曼(1990)。“基本的局部对齐搜索工具。”J. Mol. Biol.215, 403 - 410。

李普曼(1997)。Gapped BLAST和PSI-BLAST:新一代的蛋白质数据库搜索程序。Nucleic Acids Res.25, 3389 - 3402。

之前介绍过的R2006a