Bioinformatics工具箱

阅读、分析和可视化基因组和蛋白质组数据

生物信息工具箱™提供算法和应用程序用于下一代测序(NGS),微阵列分析,质谱法,和基因本体论。使用工具箱功能,您可以从SAM,Fasta,Cel和CDF等标准文件格式读取基因组和蛋白质组学数据,以及从诸如NCBI基因表达的Omnibus和Genbank等在线数据库®。您可以使用序列浏览器,空间热带和群集图来探索和可视化此数据。该工具箱还提供用于检测峰值的统计技术,缺失数据的抵抗值以及选择特征。

您可以组合工具箱函数来支持常见的生物信息学工作流程。万博1manbetx您可以使用芯片-SEQ数据来识别转录因子;分析RNA-SEQ数据以鉴定差异表达基因;在微阵列数据中识别副本数变体和SNP;并使用质谱数据对蛋白质分布进行分类。

了解更多信息计算生物学

开始:

下一代测序分析

生物信息学工具箱为下一代测序分析提供算法和可视化技术。工具箱使您能够在执行碱基对分辨率的计算时分析整个基因组。您可以使用NGS浏览器可视化和研究短读对齐使用单端或对端短读。您还可以构建自定义分析例程,如下面的示例所示。

可视化和调查短读对齐

使用NGS浏览器,可以验证并调查支持该测量的遗传变异和基因表达分析的短读序列的比对。万博1manbetxNGS浏览器让您:

  • 可视化短读数据与核苷酸参考序列对齐
  • 比较与公共参考序列对齐的多个数据集
  • 查看参考序列的不同基部和地区的覆盖范围
  • 调查对齐读取的质量和其他细节
  • 由于基本呼叫错误或多态性,识别不匹配
  • 可视化插入和删除
  • 检索相对于参考序列的特定区域的特征注释

NGS浏览器,以粗体显示单个核苷酸多态性(SNP)。您可以显示多个数据曲目,检查峰值,识别插入和删除,并检查读取质量。

存储和管理短读序列数据

下一代测序分析中使用的数据集通常太大而无法适合物理内存。BioInformatics工具箱提供专门的数据容器,使您能够分析整个基因组。

BioIndexedFile对象允许您访问包含非统一大小条目的文本文件的内容,如序列、注释和对数据集的交叉引用。您可以从表、平面文件或特定于应用程序的格式(如SAM、FASTA和FASTQ)生成这些对象。

BioMap类从短读序列存储信息,包括序列标题,读取序列,质量分数以及关于对齐和映射到单个参考序列的数据。您可以使用对象属性和方法来探索,访问,过滤和操作生物映射对象中包含的数据。

微阵列数据分析和可视化

使用应用程序和功能以在许多数据类型中获取,可视化,分析和处理图像。

微阵列归一化

可以使用几种方法对微阵列数据进行归一化,包括low、全局均值、中位数绝对偏差(MAD)和分位数归一化。您可以将这些方法应用于整个微阵列芯片或特定区域或块。过滤和输入函数可以让您在运行分析和可视化例程之前清理原始数据。

数据分析和可视化

生物信息学工具箱让您执行背景调整和计算基因(探针集)表达值从Affymetrix®微阵列探测级数据使用鲁棒多阵列平均值(RMA)和GC鲁棒多阵列(GCRMA)程序。您可以将循环二进制分割应用于阵列CGH数据,并从微阵列实验中估计多假假假设测试的错误发现率。您还可以在两种不同的实验条件下对多个Affymetrix CEL文件或基因表达值进行探测强度进行排名不变集正常化。

用于可视化微阵列数据的专业例程包括微阵列的火山图,框图,逻辑图,I-R图和空间热图。您还可以使用G-BANDING模式可视化表表示。

使用惯例统计和机器学习工具箱™,您可以对结果进行分类,执行分层和K-means聚类,并在统计可视化中表示微阵列数据,例如具有最优叶子排序的2D聚类图、热图、主成分图和分类树。

微阵列数据的火山图显示基因表达率的显著性。

质谱数据分析

生物信息学工具箱提供了一套质谱数据分析功能。通过这些功能,可以对SELDI、MALDI、LC/MS和GC/MS数据进行预处理、分类和标记识别。预处理功能包括基线校正、平滑、校准和重采样。您可以使用M/Z轴校准原始光谱数据,并在LC/MS和GC/MS数据上执行保留时间校准。你可以同时绘制多个光谱。

您可以平滑、对齐和标准化光谱,然后使用分类和统计学习工具创建分类器,并识别潜在的生物标志物

使用生物信息学工具箱进行无标记差异蛋白质组学和代谢组学分析。

图理论,体贴学习和基因本体论

图论和可视化

BioInformatics工具箱使您可以将基本图形理论应用于稀疏矩阵。您可以创建,查看和操作图形,例如交互映射,层次结构图和路径。您可以在图中确定和查看最短路径,在有向图中测试循环,并在两个图之间查找同义。

统计学习和可视化

BioInformatics工具箱提供了在分类和统计学习算法上建立的功能统计和机器学习工具箱,包括:

  • 万博1manbetx支持向量机(SVM)和K最近邻分类器
  • 用于设置交叉验证实验的功能,并测量不同分类方法的性能
  • 交互式工具的特征选择,映射,并显示层次图和路径

统计学习和可视化。

基因本体论

BioInformatics工具箱使您可以从Matlab内访问基因本体数据库®,解析基因本体注释文件,并获得本体的子集,如祖先,后代或亲属。

序列分析

BioInformatics工具箱为基因组和蛋白质组学序列数据提供序列分析和可视化工具。您可以执行各种分析,包括多个序列对准以及系统发育树的建筑物和交互式观看和操纵。

序列比对

该工具箱提供函数,对象,和用于序列分析的方法,包括成对序列,序列分布,和多序列比对。这些包括:

  • 本地和全局序列对齐标准算法的MATLAB实现,例如Creferleman-Wunsch,Smith-Waterman和Profile隐藏的Markov Model算法
  • 渐进多序列比对
  • 对准结果矩阵的图形表示
  • 标准评分矩阵,如PAM和Blosum矩阵系列
  • 共识序列计算和序列徽标显示

探索画廊(3张图片)

序列实用程序和统计

工具箱允许您操作和分析序列以获得对数据的更深入了解。你可以:

  • 使用遗传密码将DNA或RNA序列转换为氨基酸序列
  • 对序列进行统计分析,并在序列中搜索特定模式
  • 施用限制酶和蛋白酶在序列中进行硅消化或产生随机序列进行测试用例
  • 预测RNA序列的最小自由能二级结构

序列可视化

工具箱使您能够可视化序列和对齐。您可以查看带有GenBank功能注释的序列的线性或圆形地图。你可以可视化一个RNA序列的二级结构图。交互式查看器让您探索和修改成对和多个序列比对。

系统发育树分析

工具箱使您可以创建和编辑系统发育树。您可以使用诸如Jukes-Cantor,P距离,对准 - 分数或用户定义的距离方法等广泛的相似度量来计算对准或未对准的核苷酸或氨基酸序列之间的成对距离。使用具有各种技术的层次连杆构建系统发育树,包括邻近的连接,单个和完全的连杆和未加权对组方法(UPGMA)。

工具箱支持加权和重新引导万博1manbetx树,计算子树,并计算树木的规范形式。系统发育树观众让您修剪,重新排序和重命名分支;探索距离;并读取或写入Newick格式的文件。您还可以使用Matlab中的注释工具来创建呈现质量树木。

蛋白质功能分析

该工具箱提供蛋白质序列分析技术,包括用于计算肽序列的性质的常规,例如原子组合物,等电点和分子量。您可以确定蛋白质序列的氨基酸组成,用酶切割蛋白质,并产生PDB数据的骨架图和Ramachandran图。您可以使用序列工具查看氨基酸序列的性质或使用分子观察者显示和操纵3D分子结构。

数据导入和应用程序部署

文件格式和数据库访问

您可以访问生物数据、在线数据库和Web站点的标准文件格式。生物信息学工具箱使您:

  • 从标准文件格式读取序列数据,包括FASTA, PDB和SCF
  • 从文件格式读取微阵列数据,例如Affymetrix DAT,EXP,CEL,CHP和CDF文件;想象®结果格式数据;安捷伦®特征提取软件文件;和Genepix.®GPR和GAL文件
  • 从GenBank、EMBL、NCBI BLAST、PDB等在线数据库读取数据
  • 从NCBI基因表达综合网站直接导入数据,只需一个命令
  • 从NCBI表意文字或UCSC细胞带文本文件读取细胞遗传学带信息
  • 从MZXML和JCAMP-DX文件读取质谱数据

共享算法和部署应用程序

MATLAB提供了让您将数据分析程序转换为自定义软件应用程序的工具。这些包括用于构建用户界面,视觉集成开发环境和分析器的开发工具。MATLAB应用程序部署产品可让您将MATLAB算法与现有的s manbetx 845C,C ++和Java™应用程序集成,将开发的算法和自定义接口部署为独立应用程序,将MATLAB算法转换为Microsoft®可以从任何基于COM的应用程序访问的.NET或COM组件,并创建Microsoft Excel®加载项。

您可以将MATLAB与常用的生物信息学工具(如BioPerl)、基于soap的Web服务和COM插件集成。

共享算法和部署应用程序。