主要内容

getgenbank

检索序列信息基因库数据库

语法

数据= getgenbank (AccessionNumber
getgenbank (AccessionNumber
数据= getgenbank(…“PartialSeq”,PartialSeqValue,……)
数据= getgenbank(…,去整理,ToFileValue,……)
数据= getgenbank(…“FileFormat”,FileFormatValue,……)
数据= getgenbank(…”,年代equenceOnly',SequenceOnlyValue,……)
数据= getgenbank(…“超时”,TimeOutValue,……)

参数

AccessionNumber 为序列记录指定唯一字母数字标识符的字符向量或字符串。
PartialSeqValue 包含子序列开始和结束位置的双元素整数数组StartBPEndBP指定要检索的子序列。StartBP整数是否在1和EndBPEndBP是介于StartBP和序列的长度。
ToFileValue 指定用于保存GenBank的文件名或路径和文件名的字符向量或字符串®数据。如果只指定文件名,则将文件保存到MATLAB中®当前文件夹。
FileFormatValue 指定序列信息格式的字符向量或字符串。的选择是:
  • “基因库”违约时SequenceOnlyValue

  • “FASTA”违约时SequenceOnlyValue真正的

“FASTA”,然后数据只包含两个字段,序列

SequenceOnlyValue

仅控制序列作为字符数组的返回。的选择是真正的(默认)。

TimeOutValue 连接超时,以秒为单位,指定为正标量。缺省值是5。有关详细信息,请参见在这里

描述

getgenbank从GenBank数据库检索核苷酸信息。该数据库由国家生物技术信息中心(NCBI)维护。有关GenBank数据库的详细信息,请参见

数据= getgenbank (AccessionNumber在GenBank数据库中搜索登录号并返回数据,一个包含序列信息的MATLAB结构。

提示

如果在检索genbank格式的信息时发生错误,请尝试重新运行查询。错误可能是由于与GenBank记录无关的互联网连接问题造成的。

getgenbank (AccessionNumber在MATLAB命令窗口中显示信息,而不返回数据给变量。显示的信息只是指向用于搜索和检索数据的url的超链接。

getgenbank(…”,PropertyName',PropertyValue,……)调用getgenbank使用属性名/属性值对的可选属性。您可以以任意顺序指定一个或多个属性。每一个PropertyName必须用单引号括起来,不区分大小写。这些属性名/属性值对如下所示:

数据= getgenbank(…“PartialSeq”,PartialSeqValue,……)中的指定子序列序列领域的MATLAB结构。PartialSeqValue两个元素的整数数组是否包含子序列的开始和结束位置StartBPEndBPStartBP整数是否在1和EndBPEndBP是介于StartBP和序列的长度。

数据= getgenbank(…,去整理,ToFileValue,……)将GenBank数据库返回的数据保存到一个文件中。ToFileValue是一个字符向量或字符串,指定用于保存GenBank数据的文件名或路径和文件名。如果只指定文件名,则将文件保存到MATLAB当前文件夹。该函数不向现有文件追加数据。相反,它会在没有警告的情况下覆盖现有文件的内容。

提示

您可以读取genbank格式的文件到MATLAB使用genbankread函数。

数据= getgenbank(…“FileFormat”,FileFormatValue,……)以指定格式返回序列。的选择是“基因库”“FASTA”.当“FASTA”,然后数据只包含两个字段,序列“基因库”是默认值SequenceOnlyValue“FASTA”是默认值SequenceOnlyValue真正的

数据= getgenbank(…”,年代equenceOnly',SequenceOnlyValue,……)只返回输入的序列数据,字符数组。的选择是真正的(默认)。

请注意

如果你使用“SequenceOnly”“去整理”属性,输出总是fasta格式的文件。

数据= getgenbank(…“超时”,TimeOutValue,……)设置从GenBank数据库检索数据的连接超时(以秒为单位)。

例子

示例19。检索RNA序列

为了从为人类胰岛素受体编码的第19号染色体中获取序列并将其存储在一个结构中,年代,在MATLAB命令窗口中输入:

S = getgenbank('M10051') S = LocusName: 'HUMINSR' LocusSequenceLength: '4723' LocusNumberofStrands: ' locusology: 'linear' LocusMoleculeType: 'mRNA' LocusGenBankDivision: 'PRI' LocusModificationDate: '06- jan 1995' Definition: 'Human insulin receptor mRNA, complete cds.'[] DBLink:[]关键词:胰岛素受体;酪氨酸激酶。Segment: [] Source:‘Homo sapiens (human)’source有机体:[4x65 char] Reference: {[1x1 struct]} Comment: [14x67 char] Features: [51x74 char] CDS: [1x1 struct] Sequence: [1x4723 char] SearchURL: [1x67 char] RetrieveURL: [1x101 char]
20例。检索部分RNA序列

通过观察特性字段,可以确定编码序列是位置139到4287。为了仅从第19号染色体中获取编码人类胰岛素受体的编码序列并将其存储在一个结构中,cd,在MATLAB命令窗口中输入:

cd = getgenbank(‘M10051’,‘PARTIALSEQ’,(139、4287));

兼容性的考虑

全部展开

行为在R2019a中改变

之前介绍过的R2006a