检索序列信息基因库数据库
数据
= getgenbank (AccessionNumber
)
getgenbank (AccessionNumber
)数据
= getgenbank(…“PartialSeq”,PartialSeqValue
,……)数据
= getgenbank(…,去整理,ToFileValue
,……)数据
= getgenbank(…“FileFormat”,FileFormatValue
,……)数据
= getgenbank(…”,年代equenceOnly',SequenceOnlyValue
,……)数据
= getgenbank(…“超时”,TimeOutValue
,……)
AccessionNumber |
为序列记录指定唯一字母数字标识符的字符向量或字符串。 |
PartialSeqValue |
包含子序列开始和结束位置的双元素整数数组[ 指定要检索的子序列。StartBP 整数是否在1和EndBP .EndBP 是介于StartBP 和序列的长度。 |
ToFileValue |
指定用于保存GenBank的文件名或路径和文件名的字符向量或字符串®数据。如果只指定文件名,则将文件保存到MATLAB中®当前文件夹。 |
FileFormatValue |
指定序列信息格式的字符向量或字符串。的选择是:
当 |
SequenceOnlyValue |
仅控制序列作为字符数组的返回。的选择是 |
TimeOutValue |
连接超时,以秒为单位,指定为正标量。缺省值是5。有关详细信息,请参见在这里. |
getgenbank
从GenBank数据库检索核苷酸信息。该数据库由国家生物技术信息中心(NCBI)维护。有关GenBank数据库的详细信息,请参见
在GenBank数据库中搜索登录号并返回数据
= getgenbank (AccessionNumber
)数据
,一个包含序列信息的MATLAB结构。
提示
如果在检索genbank格式的信息时发生错误,请尝试重新运行查询。错误可能是由于与GenBank记录无关的互联网连接问题造成的。
getgenbank (
在MATLAB命令窗口中显示信息,而不返回数据给变量。显示的信息只是指向用于搜索和检索数据的url的超链接。AccessionNumber
)
getgenbank(…”,
调用PropertyName
',PropertyValue
,……)getgenbank
使用属性名/属性值对的可选属性。您可以以任意顺序指定一个或多个属性。每一个PropertyName
必须用单引号括起来,不区分大小写。这些属性名/属性值对如下所示:
中的指定子序列数据
= getgenbank(…“PartialSeq”,PartialSeqValue
,……)序列
领域的MATLAB结构。PartialSeqValue
两个元素的整数数组是否包含子序列的开始和结束位置[
.StartBP
,EndBP
]StartBP
整数是否在1和EndBP
.EndBP
是介于StartBP
和序列的长度。
将GenBank数据库返回的数据保存到一个文件中。数据
= getgenbank(…,去整理,ToFileValue
,……)ToFileValue
是一个字符向量或字符串,指定用于保存GenBank数据的文件名或路径和文件名。如果只指定文件名,则将文件保存到MATLAB当前文件夹。该函数不向现有文件追加数据。相反,它会在没有警告的情况下覆盖现有文件的内容。
提示
您可以读取genbank格式的文件到MATLAB使用genbankread
函数。
以指定格式返回序列。的选择是数据
= getgenbank(…“FileFormat”,FileFormatValue
,……)“基因库”
或“FASTA”
.当“FASTA”
,然后数据
只包含两个字段,头
和序列
.“基因库”
是默认值SequenceOnlyValue
是假
.“FASTA”
是默认值SequenceOnlyValue
是真正的
.
只返回输入的序列数据
= getgenbank(…”,年代equenceOnly',SequenceOnlyValue
,……)数据
,字符数组。的选择是真正的
或假
(默认)。
请注意
如果你使用“SequenceOnly”
和“去整理”
属性,输出总是fasta格式的文件。
设置从GenBank数据库检索数据的连接超时(以秒为单位)。数据
= getgenbank(…“超时”,TimeOutValue
,……)
为了从为人类胰岛素受体编码的第19号染色体中获取序列并将其存储在一个结构中,年代
,在MATLAB命令窗口中输入:
S = getgenbank('M10051') S = LocusName: 'HUMINSR' LocusSequenceLength: '4723' LocusNumberofStrands: ' locusology: 'linear' LocusMoleculeType: 'mRNA' LocusGenBankDivision: 'PRI' LocusModificationDate: '06- jan 1995' Definition: 'Human insulin receptor mRNA, complete cds.'[] DBLink:[]关键词:胰岛素受体;酪氨酸激酶。Segment: [] Source:‘Homo sapiens (human)’source有机体:[4x65 char] Reference: {[1x1 struct]} Comment: [14x67 char] Features: [51x74 char] CDS: [1x1 struct] Sequence: [1x4723 char] SearchURL: [1x67 char] RetrieveURL: [1x101 char]
通过观察特性
字段,可以确定编码序列是位置139到4287。为了仅从第19号染色体中获取编码人类胰岛素受体的编码序列并将其存储在一个结构中,cd
,在MATLAB命令窗口中输入:
cd = getgenbank(‘M10051’,‘PARTIALSEQ’,(139、4287));