与深度学习和光子时间延长癌症诊断

作者:Bahram Jalali, Claire Lifan Chen, Ata Mahjoubfar,加州大学洛杉矶分校

接受化疗或免疫治疗为基础的治疗癌症患者必须定期接受CT和PET扫描,并在某些情况下,新的活组织切片检查,以评价治疗的功效。流式细胞术中,用于经由简单的血液测试识别的循环肿瘤细胞(CTC)的方法,是比扫描侵入少得多和 活检,并可能是一个改变游戏规则的癌症治疗。

在流式细胞术中,当它们经过一个接一个通过在流式细胞仪的小开口被检查的细胞。在传统的流式细胞仪,细胞需要荧光标记,这会影响细胞行为和妥协生存能力。成像流式细胞仪不需要标签,但在相机的速度每秒的速度比2000个细胞它们产生的图像模糊,使得它不切实际的筛选细胞群足够大的发现罕见的异常细胞。

我们的团队在加州大学洛杉矶分校的光子实验室开发了一种时间拉伸定量相位成像(TS-QPI)系统,该系统可以在没有生物标记标记的情况下对大样本进行精确分类(图1)。该系统结合了成像流式细胞术、光子时间拉伸技术(见侧注)和in开发的机器学习算法 MATLAB ® ,并且可以分类细胞与超过95%的准确度。

图1.贾拉利博士与TS-QPI系统。

选择特色

我们的TS-QPI系统产生100千兆字节每相当于每秒20个高清电影数据的第二流水的数据。对于一个单一的实验,其中一个10毫升血液样品中的每一个细胞以每秒几乎100,000个细胞成像,该系统从数据的10至50兆兆字节生成。

在MATLAB与图像处理工具箱工作™,我们开发了一个机器视觉管道从细胞图像中提取的生物物理特性。该管道还包括CellProfiler,一种开源细胞图像分析包写入在Python®。我们从每个细胞中提取了200多个特征,分为三类:表征细胞大小和形状的形态学特征,与细胞密度相关的光学相位特征,以及与细胞内细胞器大小相关的光学损失特征。线性回归表明,其中16个特征包含了分类所需的大部分信息。

评估的机器学习算法

MATLAB的一个主要优点是测试各种机器学习模型在很短的时间量的能力。我们比较了统计和机器学习工具箱™四部分类算法:通过交叉熵和反向传播训练的朴素贝叶斯,支持向量机(SVM),回归(LR),以及深层神经网络(DNN)。万博1manbetx

实验中使用一个已知浓度的样品ctc,所有四个算法(贝叶斯、支持向量机、LR、款)取得了优于85%的准确率(图2)。我们进一步提高准确性、一致性和平衡我们的机器学习分类的敏感性和特异性结合深度学习与全局优化的接受者操作特征(中华民国)。该方法在MATLAB中实现,分类准确率提高到95.5%。

图2。比较各种机器学习技术分类血细胞的准确性。

用并行计算加速实验

因为我们用大数据工作时,经常带着一个多星期来完成我们的图像处理和机器学习的过程。为了缩短这个周转时间,我们并行我们的分析使用16核处理器和并行计算工具箱™。使用简单的并行for循环(parfor),我们在16个处理器上并行运行我们的进程,将完成分析所需的时间从8天减少到大约半天。

建模和改进实验设置

在加州大学洛杉矶分校实验室光电子,MATLAB是模型开发和数据分析的主力。我们使用MATLAB开发完整的实验设置的模式,从光学和激光脉冲一路单个细胞(图3)的分类。

图3。时间拉伸定量相位成像和分析系统图。

我们用这个模型来指导改进我们的设置。例如,为了改善所使用的模型来模拟特定增益系数的信噪比。仿真结果表明我们如何以及在哪里更改设置可以提高整体性能。

建模和仿真在MATLAB系统已经救了我们的实验时间个月,是指导我们的下一个步骤。我们目前正在整合各个单元的详细模型到整个系统的模型。这些模型将使我们能够使空间分辨率以及基于类型,我们分类单元的相位分辨率之间更明智的权衡。

我们开发的系统不仅限于对癌细胞进行分类。我们还用它根据藻类细胞的脂质含量和作为生物燃料的适宜性来分类藻类细胞。我们所做的唯一重大改变是细胞流经通道内的表面涂层。我们没有对支撑分析的机器学习管道进行任何更改(图4);它自己了解到,在藻类细胞的分类中,光损失和相位特征比形态特征更重要,而癌细胞的分类则相反。

图4.机器学习管道:肿瘤细胞和藻类细胞分类。

光子时间拉伸是如何工作的

TS-QPI系统会产生一系列宽度以飞秒为单位的激光脉冲。透镜、衍射光栅、镜子和分光器将激光脉冲分散成一系列彩虹般的闪光,照亮通过细胞计的细胞。每个单元的空间信息被编码在脉冲的频谱中。光色散对不同波长的组分有不同的延迟。用这种方法处理信号,使其充分地减慢速度,以便使用电子模数转换器(ADC)实现实时数字化。

短脉冲宽度和所造成的时间伸缩在光功率的下降过程中收集的光子的数量相对较少,难以检测所得到的信号。通过使用拉曼放大器,我们在灵敏度弥补这一损失。通过减慢信号并同时放大它,该系统可以同时捕获定量光学相移和强度损失图像用于分析样品中的每个小区。

关于作者

巴赫拉姆·贾拉利是教授与Northrop Grumman光电电气工程在加州大学洛杉矶分校主席。他的研究和教学兴趣包括硅光子和光纤通信,实时流数据的采集和处理,生物光子学,稀有细胞的检测,血液筛查,无损材料测试和表征,以及流氓波动现象。

克莱尔力帆陈是Lumentum运营公司的高级应用工程师。她获得了博士学位在电气工程和理学硕士学位在分别2015和2012,从加州大学洛杉矶分校生物工程。她的研究兴趣包括机器学习,数据采集和分析,图像处理,以及高通量与生物医药和信息技术应用的成像。

Ata Mahjoubfar在加州大学洛杉矶分校获得电子工程博士学位,目前是一名博士后学者。他的研究兴趣包括人工智能、机器视觉和学习、图像和信号处理、成像和可视化、超快数据采集和分析、生物医学技术和金融工程。

出版2017 - 93090v00


查看文章的相关能力

查看相关行业的文章