麻省理工学院整合了实验室和教室的癌症研究

挑战

通过鉴定蛋白质和分析它们的相互作用来改进癌症诊断技术

解决方案

使用MathWorks工具使学生和研究人员能够分析质谱数据,模拟复杂的蛋白质相互作用,并可视化结果

结果

  • 教育与研究相结合
  • 计算时间缩短了一个数量级
  • 研究资助赢得了

“研究人员通常对结果感兴趣,而不是编程。MATLAB使我们能够在更高的抽象层次上思考,并且花费更少的时间开发、调试、测试和创建图形。因此,我们更快地获得研究成果。”

吉尔艾托维茨博士,马萨诸塞州理工学院和哈佛大学
Alterovitz博士介绍生物分子网络。

在癌症的早期诊断可以大大提高病人的生存机会。例如,卵巢癌通常只有在进展到三、四期后才被确诊。对于一、二期确诊的患者,五年内存活的几率从不足50%提高到95%左右。

马萨诸塞州理工学院(麻省理工学院)的研究人员和学生正在通过检查血液蛋白来探索患者在早期阶段诊断癌症的方法。使用MathWorks工具,这些研究人员正在识别仅在癌症患者中存在的蛋白质和蛋白质相互作用,以实现早期癌症检测。学生使用MathWorks工具来学习并促进研究小组的努力,同时获得了推动未来生物医学进步的知识和经验。

“在生物信息学中,两年前进行的研究被认为是旧的。随着Mathworks工具,我们可以在MIT / HARVARD的NIH生物医学信息学家吉尔艾米特博士博士说,我们可以参与我们的小组正在进行的前沿研究。”卫生科技分工。“MathWorks工具使研究小组和学生包括生物专业和工程师 - 包括研究,并花费更少的时间编程。”

将复杂生物分子网络(左)转换为抽象表示(右)的新方法是促进其固有组件的发现和表征。

挑战

为了更好地鉴定可能发出癌症存在的蛋白质,MIT和哈佛医学院的研究人员,包括Alterovitz,Marco F. Ramoni和Isaac S. Kohane,并寻求将质谱(MS)结果结合在蛋白质如何相互作用的知识。MS数据包括可以分析的特征峰和谷,以区分样品中的分子化合物。研究人员需要工具来处理此数据并构建复杂的模型以表示蛋白质相互作用。

“我们不得不分析包含数百万数据点的质谱数据,”Alterovitz解释说。“我们还需要模拟交互生物分子网络,执行统计计算,以及对该网络性质的其他分析,并将这些与质谱结果相结合。”

与这项研究同时,Alterovitz还发起并指导了一门名为生物信息学与蛋白质组学:一种基于工程问题解决的方法. 高年级本科生和一、二年级研究生都参加了这个班。Alterovitz希望通过一套工具使课程标准化,使学生能够从正在进行的研究中受益,同时又易于学习。

“既然我们有时间限制,我们不想浪费时间教学生一门新语言,”Alterovitz解释道我们需要一个大多数学生已经熟悉的工具,一个生物学家和工程师都能轻松学习的工具。”
利用MATLAB分析和生成生物网络,通过3D立体眼镜、语音识别和头部跟踪进行交互研究。

解决方案

麻省理工学院的研究人员正在使用Mathworks工具来推进生物信息学和蛋白质组学。麻省理工学院学生正在使用相同的工具来获得这些领域的动手体验。

在实验室里

Alterovitz和他的研究小组使用了MATLAB®开发用于分析MS数据的算法,并对由20000多个节点和100000条边组成的蛋白质交互网络进行建模。每个网络节点代表一个与蛋白质相关的质量,每个边缘代表节点之间的相互作用。

研究人员还使用MATLAB可视化数据,绘制结果,并访问与其他生物医学研究人员共享的数据库。

由于MS数据类似于声音或语音数据中的一系列峰值和谷,因此研究人员可以应用信号处理技术来处理数据。MIT研究人员使用信号处理工具箱™来处理此MS数据和应用过滤器以消除噪声和无关数据,使它们能够集中在更可管理的数据集上。

生物信息学工具箱™ 使研究小组能够从各种互联网资源中快速获得有关蛋白质的信息。该团队使用生物信息学工具箱计算分子量,获得氨基酸序列以及特定蛋白质的其他特性,下载并解析信息到可由MATLAB访问的数据结构中。

麻省理工学院的研究人员使用了统计学和机器学习工具箱™ 计算网络特性,包括连通性和幂律分布。他们使用模型来计算样本中蛋白质的数量,使用统计学和机器工具箱来简化曲线拟合,并生成负二项分布、伽玛分布和指数分布。

该小组的研究涉及数百名患者的数百万MS数据点。然而,由于每个患者的数据是独立的,因此处理信息的任务是并行化的理想选择。使用并行计算工具箱™ 与MATLAB并行服务器™, 这个小组在一个大的计算机集群上同时执行他们的MATLAB算法。

研究小组在不同的处理器上独立分析每位患者的MS数据。Alterovitz解释说:“除了显著减少计算时间外,并行计算工具箱使我们能够快速编程这种方法。我们没有学习分布式编程,而是使用现有的MATLAB代码,并使用并行计算工具箱使其并行化。”

该团队还使用分布式方法来加速网络属性和统计数据的计算,方法是将网络划分为块并并行运行任务。

在教室里

对于生物信息学和蛋白质组学课程,Alterovitz和他的同事教练选择了Matlab的易用性,与其他工具的互操作性,以及在提高抽象水平下提出概念的能力。

“大约90%的课程已经使用了matlab,”艾伦托茨说。“每个人都开始立即使用matlab - 即使是那些没有先前经验的人 - 因为你不需要知道如何编程以便使用它。”

此外,Matlab为学生提供了一种简单的方法来获取和学习在麻省理工学院和哈佛达的领先研究。

该课程的教学方法是基于精化理论。它涉及到使用有限的一组概念和例子,并逐渐增加复杂性。Alterovitz解释说,“MATLAB通过不同的抽象层次,本质上支持不同层次的复杂性。开始时,学生运行代码并将结果可视化。之后,他们可以探索、更新代码,甚至将代码与其他编程语言集成,以添加更多细节。”万博1manbetx

课程作业还反映了这种方法跨生物水平。学生们首先使用MathWorks工具来分析基本DNA序列信息。然后,它们进展到更复杂的表达数据,蛋白质,并最终使用网络模型在蛋白质和其他分子之间的相互作用。

结果

  • 教育与研究相结合. "有了MATLAB,我们可以向学生们提供最新的代码和我所在小组和其他小组的研究成果通过他们所获得的经验,学生们可以协助研究小组并为我们的努力做出贡献。”

  • 计算时间缩短了一个数量级. "使用MATLAB代码的分布式方法,我们在一个计算机集群上运行了我们的分析,并将计算时间从大约一周减少到不到一天。这是至关重要的,因为我们面临着一个会议的最后期限,结果发挥了关键作用,我们的工作得到接受,”奥特洛维茨说。

  • 研究资助赢得了。“在完成课程后,一名生物学学生在我的研究小组工作后,下学期并获得了麻省理工学院本科研究机会计划补助金,”Alterovitz说。“与Matlab一起,他很快就成了富有成效,并及时得到结果,以申请该授予;这将不可能。”

麻省理工学院是全世界1300所大学之一,这些大学在校园范围内提供MATLAB和Simulink。有了校园范围的许可证,研究人员、教员和学生可以访问最新版本的产品的通用配置,以便在教室万博1manbetx、家中、实验室或现场的任何地方使用。s manbetx 845