生物信息学工具箱™可以让你访问过很多数据库的网站和其他在线数据存储库上。它可以让你将数据复制到MATLAB®工作区,读取和写入标准的生物信息学格式的文件。它还读取许多常见的基因组的文件格式,这样你就不必编写和维护自己的文件阅读器。
基于Web的数据库- 您可以直接访问Web上的公共数据库和复制序列和基因表达信息到MATLAB环境。
目前支持的序列数据库GenBank中有万博1manbetx®(getgenbank
),GenPept登记(getgenpept
),欧洲分子生物学实验室(EMBL)(getembl
)和蛋白质数据库(PDB)(getpdb
)。您可以通过使用一个单一的功能从NCBI基因表达总括(GEO)网站还访问数据(getgeodata
)。
获取多重比对序列(gethmmalignment
),隐马尔可夫模型谱(gethmmprof
),以及系统发生树数据(gethmmtree
)从PFAM数据库。
基因本体论数据库- 从web加载数据库到基因本体对象(geneont
)。本体的选择部分与该geneont对象的方法(getancestors(geneont)
,getdescendants (geneont)
,getmatrix(geneont)
,getrelatives(geneont)
),并操纵以效用函数数据(goannotread
,num2goid
)。
读取仪器数据- 从基因测序仪产生的读数据(scfread
,joinseq
,traceplot
),质谱仪(jcampread
)和安捷伦®芯片扫描仪(agferead
)。
读数据格式- 该工具箱提供了许多功能用于从共同的生物信息学的文件格式读取数据。
序列数据:GenBank登录(genbankread
),GenPept登记(genpeptread
),EMBL(emblread
), PDB (pdbread
),和FASTA(fastaread
)
多重对齐序列:ClustalW和GCG格式(multialignread
)
从微阵列基因表达数据:基因表达综合(GEO)数据(geosoftread
)的GenePix®探地雷达及加仑档案的资料(gprread
,galread
),SPOT数据(sptread
),Affymetrix公司®基因芯片®数据(affyread
),和ImaGene®结果文件(imageneread
)
隐马尔可夫模型简介:PFAM-HMM文件(pfamhmmread
)
写数据格式- 用于获取从Web数据的功能包括将数据保存到文件的选项。然而,存在使用FASTA格式的功能,写数据到一个文件(fastawrite
)。
BLAST搜索- 请求的基于Web的BLAST搜索(blastncbi
),得到的搜索结果(getblast
),并从以前保存的BLAST格式的报告,文件读取的结果(blastread
)。
MATLAB环境下已经内置了对其他行业标准文件格式,包括支持万博1manbetx微软®高强®和逗号分隔值(CSV)文件。附加功能进行ASCII和低级别的二进制I / O,让你开发定制的功能与任何数据格式工作。