创建远程NCBI爆炸报告请求ID或链接到NCBI爆炸报告
blastncbi (
发送一个爆炸请求NCBI反对Seq
,程序
)Seq
,一个核苷酸或氨基酸序列,使用程序
,一个指定的BLAST程序。然后返回一个链接到NCBI爆炸报告。在选择适当的爆炸计划的帮助,访问https://blast.ncbi.nlm.nih.gov/producttable.shtml。
对蛋白质序列执行BLAST搜索,并将结果保存到XML文件中。
从蛋白质数据库中获取序列并创建一个MATLAB结构。
S = getpdb (“1文明”);
使用该结构作为BLAST搜索的输入,显著性阈值为1平台以及
。第一个输出是请求ID,第二个输出是搜索完成之前的估计时间(以分钟为单位)。
[RID1,死记硬背]= blastncbi(年代,“blastp”,“期望”1平台以及);
从报告中获取搜索结果。您可以将xml格式的报告保存为一个文件,以便脱机访问。使用死记硬背作为检索结果的等待时间。
report1 = getblast (RID1,“WaitTime”死记硬背,“去整理”,“1 civ_report.xml”)
Blast的结果还没有出来。请稍等…report1 = struct with fields: RID: 'R49TJMCF014'算法:'BLASTP 2.6.1+'数据库:'nr' QueryID: 'Query_224139' QueryDefinition: '未命名蛋白产品' Hits:[1×100 struct]参数:[1×1 struct]统计:[1×1 struct]
使用blastread
从xml格式的BLAST报告文件中读取BLAST数据。
blastdata = blastread (“1 civ_report.xml”)
QueryID: 'Query_224139' QueryDefinition: '未命名蛋白产品' Hits:[1×100 struct]参数:[1×1 struct]统计:[1×1 struct]
或者,使用NCBI登录号运行BLAST搜索。
RID2 = blastncbi (“AAA59174”,“blastp”,“期望”1、平台以及)
RID2 = ' R49WAPMH014 '
从报告中获取搜索结果。
report2 = getblast (RID2)
Blast的结果还没有出来。请稍等…report2 = struct with fields: RID: 'R49WAPMH014'算法:'BLASTP 2.6.1+'数据库:'nr' QueryID: 'AAA59174.1' QueryDefinition: '胰岛素受体前体[人类]' Hits:[1×100 struct]参数:[1×1 struct]统计:[1×1 struct]
Seq
- - - - - -核苷酸或氨基酸序列指定为字符向量、字符串或MATLAB结构的核苷酸或氨基酸序列序列
字段。
如果Seq
是字符向量或字符串,可用选项有:
基因库®、GenPept或RefSeq登录号
FASTA文件的名称
指向序列文件的URL
程序
- - - - - -爆炸的程序BLAST程序,指定为下列程序之一:
“blastn”
-搜索核苷酸查询与核苷酸数据库。
“blastp”
-搜索蛋白质查询与蛋白质数据库。
“blastx”
-搜索(翻译)核苷酸查询与蛋白质数据库。
“megablast”
-寻找高度相似的核苷酸序列。
“tblastn”
-搜索蛋白质查询与翻译核苷酸数据库。
“tblastx”
-搜索(翻译)核苷酸查询与(翻译)核苷酸数据库。
的可选逗号分隔对名称,值
参数。的名字
参数名称和价值
为对应值。的名字
必须出现在引号内。可以按任意顺序指定多个名称和值对参数Name1, Value1,…,的家
。
“矩阵”、“PAM70”,“期望”,1平台以及
使用PAM70
替换矩阵,匹配的显著性阈值设置为1e-10。
“数据库”
- - - - - -数据库搜索nr的
(默认)|特征向量|字符串要搜索的数据库,指定为逗号分隔对组成的“数据库”
和字符向量或字符串。
对于核苷酸数据库,有效的选择是:
nr的
(默认)
“refseq_rna”
“refseq_genomic”
est
“est_human”
“est_mouse”
“est_others”
“gss”
高温凝胶的
“拍”
pdb的
“铝合金”
“dbsts”
“染色体”
对于蛋白质数据库,有效的选择是:
nr的
(默认)
“refseq_protein”
“swissprot”
“拍”
pdb的
“env_nr”
可用的数据库可能会改变。检查NCBI网站为更多的信息。
为了帮助选择一个适当的数据库,访问
。“MaxNumberSequences”
- - - - - -返回的最大命中次数返回的最大命中次数,指定为逗号分隔的对“MaxNumberSequences”
一个正整数。实际搜索结果的命中次数可能比您指定的要少,这取决于查询、数据库、期望值和其他参数。默认值为One hundred.
。
“过滤”
- - - - - -过滤器应用于查询序列筛选器应用于查询序列,指定为逗号分隔的对,由“过滤”
和下列之一:
“L”
-低成分复杂性的掩模区域。
“R”
-屏蔽人类重复元素(有效的blastn
和megablast
只有)。
“米”
-在产生爆炸种子时屏蔽查询,但不在扩展期间。
“没有”
-不敷面膜。
“l”
-屏蔽查询中的任何小写字母。
您可以在单个字符向量或字符串中指定多个有效字母,以同时应用多个筛选器。例如,“Lm”
同时应用低合成复杂度的滤镜和蒙版。
选择取决于所选的内容程序
。有关更多信息,请参见表可选属性的选择由BLAST程序。
“期望”
- - - - - -匹配的统计显著性阈值10
(默认)|正实数与数据库序列匹配的统计显著性阈值,指定为逗号分隔的对,由“期望”
一个正的实数。默认值是10
。
有关局部序列比较的统计信息,请访问https://blast.ncbi.nlm.nih.gov/tutorial/Altschul-1.html#head2。
“词”
- - - - - -查询序列的字长查询序列的字长,指定为逗号分隔的对,由“词”
一个正整数。
蛋白质查询搜索的选择有:
2
3.
(默认)
核苷酸查询搜索的选择有:
7
11
(默认)
15
选择的时候程序
被设置为“megablast”
是:
16
20.
24
28
(默认)
32
48
64
128
“矩阵”
- - - - - -氨基酸序列的取代矩阵“BLOSUM62”
(默认)|特征向量|字符串置换矩阵为氨基酸序列,指定为逗号分隔的对所组成“矩阵”
和字符向量或字符串。矩阵为任意两个氨基酸残基的可能对齐分配分数。的选择是:
“PAM30”
“PAM70”
“BLOSUM45”
“BLOSUM62”
(默认)
“BLOSUM80”
“MatchScores”
- - - - - -核苷酸比对中的匹配和不匹配得分核苷酸比对中的匹配和不匹配分数,指定为逗号分隔的一对“MatchScores”
和一个两元素的数值向量(R, Q)
。第一个元素R
匹配分数和第二个元素是什么问
为失配得分。此选项用于blastn
和megablast
只有。
为了保证对对准意义的准确评估,只支持有限的组合。万博1manbetx看到表爆炸可选属性所有支持的值。万博1manbetx的默认值megablast
是(1 2)
的默认值blastn
是3 [1]
。
“GapCosts”
- - - - - -对开放和扩大差距的处罚打开和扩展间隙的惩罚,指定为逗号分隔的对,由“GapCosts”
和一个两元素的数值向量。这个向量包含两个整数:第一个是打开间隙的惩罚,第二个是扩展间隙的惩罚。
有效缺口成本blastp
,blastx
,tblastn
,tblastx
根据蛋白质替代基质的不同而有所不同。有关详细信息,请参见blastp, blastx, tblastn,和tblastx的差距。
有效缺口成本blastn
和megablast
根据不同MatchScores
((R, Q)
)。有关详细信息,请参见伯恩和兆宝的差距。
“CompositionAdjustment”
- - - - - -补偿氨基酸组成的成分调整型“没有”
(默认)|“哥伦比亚广播公司”
|“实验”
|“ucsm”
补偿被比较序列的氨基酸组成的成分调整类型,指定为逗号分隔的对,由“CompositionAdjustment”
和下列价值观之一:
“没有”
-没有调整应用(默认)。
“哥伦比亚广播公司”
-基于作文的统计方法用于分数调整。
“实验”
-条件合成分数矩阵用于分数调整。
“ucsm”
-通用合成分数矩阵用于分数调整。
此选项用于blastp
,blastx
,tblastn
只有。得到的标度分数比标准的未标度分数产生更准确的e值。有关详细信息,请参见成分的调整。
“可以”
- - - - - -Entrez查询语法,用于搜索所选数据库的子集用于搜索所选数据库子集的Entrez查询语法,指定为逗号分隔的对,由“可以”
和字符向量或字符串。使用此选项可以根据分子类型、序列长度、生物体等限制搜索。有关限制搜索的更多信息,请参见https://blast.ncbi.nlm.nih.gov/blastcgihelp.shtml#entrez_query。
“阿”
- - - - - -高级选项高级选项,指定为逗号分隔的对,由“阿”
和字符向量或字符串。例如,要指定核苷酸匹配和不匹配的奖励和惩罚值,可以使用'- r1 -q -3'
。有关更多信息,请参见https://www.ncbi.nlm.nih.gov/blast/Doc/urlapi.html。
可选属性的选择由BLAST程序
当爆炸程序是… | 那么以下选项的选择是… | |||||
---|---|---|---|---|---|---|
数据库 | 过滤器 | 词 | 矩阵 | MatchScores(R, Q) |
GapCosts | |
“blastn” |
nr的 (默认)“refseq_rna” “refseq_genomic” est “est_human” “est_mouse” “est_others” “gss” 高温凝胶的 “拍” pdb的 “铝合金” “dbsts” “染色体” |
“Lm” (默认)“R” “米” “l” “没有” |
7 11 (默认)15 |
- - - - - - | 3 [1] (默认)(1 - 4) (1 2) [1] 3 [2] 5 [4] |
看到伯恩和兆宝的差距。 |
“megablast” |
16 20. 24 28 (默认)32 48 64 128 |
3 [1] (1 - 4) (1 2) (默认)[1] 3 [2] 5 [4] |
||||
“tblastn” |
“L” (默认)“米” “l” “没有” |
2 3. (默认) |
“PAM30” “PAM70” “BLOSUM45” “BLOSUM62” (默认)“BLOSUM80” |
- - - - - - | 看到blastp, blastx, tblastn,和tblastx的差距。 | |
“tblastx” |
||||||
“blastp” |
nr的 (默认)“refseq_protein” “swissprot” “拍” pdb的 “env_nr” |
“L” “米” “l” “没有” (默认) |
||||
“blastx” |
“L” (默认)“米” “l” “没有” |
GapCosts为blastp
,blastx
,tblastn
,tblastx
替换矩阵 | 有效的“GapCosts” 值 |
---|---|
“PAM30” |
(7 - 2) (6 - 2) (5 - 2) (10 - 1) (9 - 1) (默认)8 [1] |
“PAM70” |
8 [2] (7 - 2) (6 - 2) (11 - 1) (10 - 1) (默认)(9 - 1) |
“BLOSUM80” |
|
“BLOSUM45” |
[13 3] [12 3] [11 3] 3 [10] [15 2] (默认)(14 - 2) (13 - 2) (12 - 2) (19 (1) [18 1] (17 - 1) [16 1] |
“BLOSUM62” |
(9 - 2) 8 [2] (7 - 2) (12 - 1) (11 - 1) (默认)(10 - 1) |
GapCosts为blastn
和megablast
MatchScores (R, Q) | 有效的“GapCosts” 值 |
---|---|
(1 - 4) |
(5 - 2) (默认)(1 2) (0 - 2) (2 - 1) [1] |
3 [1] |
(5 - 2) (默认)(2 - 2) (1 2) (0 - 2) (2 - 1) [1] |
(1 2) |
(5 - 2) (默认)(2 - 2) (1 2) (0 - 2) (3 - 1) (2 - 1) [1] |
[1] |
(5 - 2) (默认)(3 - 2) (2 - 2) (1 2) (0 - 2) (4 - 1) (3 - 1) (2 - 1) |
3 [2] |
(5 - 2) (默认)(4 - 4) (2 - 4) [0 4] [3 3] (6 - 2) (4 - 2) (2 - 2) |
5 [4] |
(5 - 2) (默认)(6 - 5) 5 [5] 5 [4] [3 - 5] |
“psiblast”
爆炸程序已被删除从R2017b开始的错误
爆炸计划“psiblast”
已从支持的程序之一删除。万博1manbetx
“包容”
选项已被移除从R2017b开始的错误
的“包容”
名称-值对已被删除,因为它仅适用于psiblast
已被删除的程序。
“描述”
选项已被移除从R2017b开始的错误
的“描述”
名称-值对已被删除。使用“MaxNumberSequences”
而不是指定要返回的最大命中次数。
“联盟”
选项已被移除从R2017b开始的错误
的“联盟”
名称-值对已被删除。使用“MaxNumberSequences”
而不是指定要返回的最大命中次数。
“GapOpen”
选项已被移除从R2017b开始的错误
的“GapOpen”
名称-值对已被删除。使用“GapCosts”
代替。
“ExtendGap”
选项已被移除从R2017b开始的错误
的“ExtendGap”
名称-值对已被删除。使用“GapCosts”
代替。
Pct的
选项已被移除从R2017b开始的错误
的Pct的
名称-值对已被删除。
李普曼(1990)。“基本的局部对齐搜索工具。”J. Mol. Biol.215, 403 - 410。
李普曼(1997)。Gapped BLAST和PSI-BLAST:新一代的蛋白质数据库搜索程序。Nucleic Acids Res.25, 3389 - 3402。
您点击了对应于以下MATLAB命令的链接:
通过在MATLAB命令窗口中输入该命令来运行该命令。Web浏览器不支持MATLAB命令。万博1manbetx
您也可以从以下列表中选择一个网站:
选择中国网站(中文或英文)以获得最佳网站性能。其他MathWorks国家站点没有针对您所在位置的访问进行优化。