麻省理工学院的研究人员正在使用Mathworks工具来推进生物信息学和蛋白质组学。麻省理工学院学生正在使用相同的工具来获得这些领域的动手体验。
在实验室里
Alterovitz和他的研究小组使用了MATLAB®开发用于分析MS数据的算法,并对由20000多个节点和100000条边组成的蛋白质交互网络进行建模。每个网络节点代表一个与蛋白质相关的质量,每个边缘代表节点之间的相互作用。
研究人员还使用MATLAB可视化数据,绘制结果,并访问与其他生物医学研究人员共享的数据库。
由于MS数据类似于声音或语音数据中的一系列峰值和谷,因此研究人员可以应用信号处理技术来处理数据。MIT研究人员使用信号处理工具箱™来处理此MS数据和应用过滤器以消除噪声和无关数据,使它们能够集中在更可管理的数据集上。
生物信息学工具箱™ 使研究小组能够从各种互联网资源中快速获得有关蛋白质的信息。该团队使用生物信息学工具箱计算分子量,获得氨基酸序列以及特定蛋白质的其他特性,下载并解析信息到可由MATLAB访问的数据结构中。
麻省理工学院的研究人员使用了统计学和机器学习工具箱™ 计算网络特性,包括连通性和幂律分布。他们使用模型来计算样本中蛋白质的数量,使用统计学和机器工具箱来简化曲线拟合,并生成负二项分布、伽玛分布和指数分布。
该小组的研究涉及数百名患者的数百万MS数据点。然而,由于每个患者的数据是独立的,因此处理信息的任务是并行化的理想选择。使用并行计算工具箱™ 与MATLAB并行服务器™, 这个小组在一个大的计算机集群上同时执行他们的MATLAB算法。
研究小组在不同的处理器上独立分析每位患者的MS数据。Alterovitz解释说:“除了显著减少计算时间外,并行计算工具箱使我们能够快速编程这种方法。我们没有学习分布式编程,而是使用现有的MATLAB代码,并使用并行计算工具箱使其并行化。”
该团队还使用分布式方法来加速网络属性和统计数据的计算,方法是将网络划分为块并并行运行任务。
在教室里
对于生物信息学和蛋白质组学课程,Alterovitz和他的同事教练选择了Matlab的易用性,与其他工具的互操作性,以及在提高抽象水平下提出概念的能力。
“大约90%的课程已经使用了matlab,”艾伦托茨说。“每个人都开始立即使用matlab - 即使是那些没有先前经验的人 - 因为你不需要知道如何编程以便使用它。”
此外,Matlab为学生提供了一种简单的方法来获取和学习在麻省理工学院和哈佛达的领先研究。
该课程的教学方法是基于精化理论。它涉及到使用有限的一组概念和例子,并逐渐增加复杂性。Alterovitz解释说,“MATLAB通过不同的抽象层次,本质上支持不同层次的复杂性。开始时,学生运行代码并将结果可视化。之后,他们可以探索、更新代码,甚至将代码与其他编程语言集成,以添加更多细节。”万博1manbetx
课程作业还反映了这种方法跨生物水平。学生们首先使用MathWorks工具来分析基本DNA序列信息。然后,它们进展到更复杂的表达数据,蛋白质,并最终使用网络模型在蛋白质和其他分子之间的相互作用。