主要内容

数据格式和数据库

生物信息工具箱™允许您访问的数据库在网络上和其他在线数据存储库。它允许您将数据复制到MATLAB®工作区和读写文件与标准生物格式。也读许多常见基因组文件格式,所以您不必编写和维护自己的文件读者。

基于网络的数据库——你可以直接访问网络上的公共数据库中,序列和基因表达信息复制到MATLAB环境。

目前序列数据库支持基因库万博1manbetx®(getgenbank),GenPept (getgenpept),欧洲分子生物学实验室(EMBL) (getembl)和蛋白质数据库(PDB) (getpdb)。你也可以访问数据从NCBI基因表达综合(GEO)网站通过使用一个函数(getgeodata)。

得到繁殖对齐序列(gethmmalignment)、隐马尔可夫模型简介(gethmmprof),系统发育树的数据(gethmmtree)包含了数据库。

基因本体数据库——从网络数据库加载到一个基因本体论对象(geneont)。本体与方法的选择部分geneont对象(getancestors,getdescendents,getmatrix,getrelatives),与效用函数和操作数据(goannotread,num2goid)。

从设备读取数据来自基因测序仪器读取数据(scfread,joinseq,traceplot),质谱仪(jcampread)、安捷伦®芯片扫描仪(agferead)。

读取数据格式——功能的工具箱提供了许多从常见的生物信息学读取数据文件格式。

写数据格式——从网上获取数据的功能包括将数据保存到一个文件的选项。然而,有一个函数来写入数据到一个文件中使用FASTA格式(fastawrite)。

爆炸的搜索-请求网络爆炸搜索(blastncbi),得到一个搜索结果(getblast)和从以前保存的爆炸读取结果格式化的报告文件(blastread)。

MATLAB环境对其他行业标准文件格式包括的内置支持万博1manbetx微软®Excel®和逗号分隔值(CSV)文件。额外的功能执行ASCII和低级二进制文件I / O,允许您开发自定义函数来处理任何数据格式。

相关的话题