技术文章和通讯

具有深度学习和光子时间拉伸的癌症诊断

作者:Bahram Jalali, Claire Lifan Chen, Ata Mahjoubfar,加州大学洛杉矶分校


接受化疗或免疫治疗的癌症患者必须接受常规CT和PET扫描,在某些情况下,还必须接受新的活组织检查,以评估治疗的疗效。流式细胞术是一种通过简单的血液测试来识别循环肿瘤细胞(ctc)的方法,它的侵袭性比扫描和扫描要小得多 活组织检查,并可能成为癌症治疗的游戏规则改变者。

在流式细胞仪中,当细胞逐个通过流式细胞仪的一个小开口时进行检查。在传统的流式细胞术中,细胞需要荧光标记,这会影响细胞行为并损害细胞活力。成像流式细胞仪不需要标签,但当摄像机速度超过每秒2000个细胞时,它们会产生模糊图像,因此无法对足够大的细胞群进行筛选,以发现罕见的异常细胞。

我们在加州大学洛杉矶分校(UCLA)光子实验室的团队开发了一种时间延伸定量相位成像(TS-QPI)系统,可以在没有生物标记的情况下对大样本进行准确分类(图1) MATLAB ® 并能以95%以上的准确率对细胞进行分类。

图1:TS-QPI系统的Jalali博士。

选择特征

我们的TS-QPI系统每秒生成100 GB的数据,相当于每秒20部高清电影的数据量。在一个实验中,10毫升血液样本中的每个细胞都以每秒近100000个细胞的速度成像,系统生成10到50TB的数据。

在MATLAB中使用图像处理工具箱™, 我们开发了一个机器视觉管道,用于从细胞图像中提取生物物理特征。该管道还包括CellProfiler,一个用Python编写的开源细胞图像分析软件包®.我们从每个细胞中提取了超过200个特征,分为三类:表征细胞大小和形状的形态学特征,与细胞密度相关的光学相位特征,与细胞内细胞器大小相关的光学损失特征。线性回归表明,其中16个特征包含了分类所需的大部分信息。

评估机器学习算法

MATLAB的一个主要优点是能够在短时间内测试各种各样的机器学习模型。我们比较了统计和机器学习工具箱中的四种分类算法™: 朴素贝叶斯、支持向量机(SVM)、逻辑回归(LR)和通过交叉熵和反向传播训练的深层神经网络(DNN)。万博1manbetx

在使用已知ctc浓度的样本进行的测试中,所有四种算法(Bayes、SVM、LR和DNN)的准确率都超过85%(图2)。我们进一步提高了准确率、一致性,以及通过深度学习与接收者工作特征(ROC)的全局优化相结合,在机器学习分类的敏感性和特异性之间取得平衡。在MATLAB中实现,该方法将分类准确率提高到95.5%。

图2。血液细胞分类的各种机器学习技术的准确性比较。

用并行计算加速实验

因为我们在处理大数据,所以通常需要超过一周的时间来完成图像处理和机器学习过程。为了缩短这个周转时间,我们使用16核处理器和Parallel Computing Toolbox™并行化了我们的分析。使用简单的并行for循环(parfor),我们在16个处理器上并发运行我们的进程,将完成分析所需的时间从8天减少到大约半天。

建模和改进实验设置

在加州大学洛杉矶分校的光子学实验室,MATLAB是模型开发和数据分析的主要工具。我们使用MATLAB开发了完整实验装置的模型,从光学和激光脉冲到单个细胞的分类(图3)。

图3。时间拉伸定量相位成像和分析系统图。

我们使用该模型来指导对设置的增强。例如,为了提高信噪比,我们使用该模型来模拟特定的增益系数。仿真结果向我们展示了对设置的更改如何以及在何处可以提高总体性能。

在MATLAB中对系统进行建模和仿真为我们节省了数月的实验时间,并为我们的下一步工作提供了指导。我们目前正在将单个细胞的详细模型整合到整个系统模型中。这些模型将使我们能够根据ce的类型在空间分辨率和相位分辨率之间做出更好的权衡我们正在分类。

我们开发的系统不仅局限于癌细胞的分类。我们还用它来根据藻类细胞的脂质含量和生物燃料的适用性对其进行分类。我们所做的唯一重大改变是细胞流过的通道的表面涂层。我们没有改变支撑分析的机器学习管道(图4);它自己了解到,在藻类细胞的分类中,光学损耗和相位特征比形态特征更重要,而在癌症细胞中,则相反。

图4。机器学习管道:癌细胞和藻类细胞分类。

光子时间伸缩是如何工作的

TS-QPI系统可以产生一系列以飞秒为单位宽度的激光脉冲。透镜、衍射光栅、镜子和分束器将激光脉冲分散成一列彩虹闪光,照亮通过细胞仪的细胞。每个细胞上的空间信息被编码在脉冲的频谱中。光色散对不同的波长分量施加不同的延迟。以这种方式光处理信号足以减缓它们的速度,从而能够使用电子模数转换器(ADC)进行实时数字化。

在短脉冲宽度期间收集的光子数量相对较低,且时间拉伸导致光功率下降,因此很难检测到产生的信号。我们使用拉曼放大器来补偿这种灵敏度损失。通过减慢信号并同时放大,系统可以同时捕获样本中每个细胞的定量光学相移和强度损失图像。

关于作者

Bahram Jalali是加州大学洛杉矶分校电气工程学院的教授和诺斯罗普·格鲁曼光电主席。他的研究和教学兴趣包括硅光子学和光纤通信,实时流数据采集和处理,生物光子学,稀有细胞检测,血液筛查,无损材料测试和表征,异常波现象。

Claire Lifan Chen是Lumentum Operations LLC的高级应用工程师,她获得了博士学位。在电气工程和理学硕士学位。分别于2015年和2012年从加州大学洛杉矶分校获得生物工程学位。她的研究兴趣包括机器学习、数据采集和分析、图像处理和高通量成像,以及生物医学和信息技术的应用。

Ata Mahjoubfar在加州大学洛杉矶分校获得电气工程博士学位,目前是加州大学洛杉矶分校的博士后学者。他的研究兴趣包括人工智能、机器视觉和学习、图像和信号处理、成像和可视化、超快数据采集和分析、生物医学技术和金融工程。

发布于2017 - 93090v00

查看相关功能的文章

查看相关行业的文章