人工智能在肺结节诊断中的应用及展望-AI云资讯

在我国，肺癌具有明显的发病率高、病死率高、5年存活率低的特点。肺癌的早期诊断及治疗对于提高肺癌患者的生存率具有极其重要的意义。低剂量CT检查是目前早期肺癌首选的筛查手段，人工智能辅助诊断肺结节性质具有提高诊断敏感度、特异度及临床医师工作效率的优势。本文就目前人工智能的主要技术及其在肺结节早期诊断中的应用作一综述。

研究表明，我国肺癌发病率居恶性肿瘤首位(57.36/10万)[1]，而且无论男女，病死率也均居第一，5年生存率只有19.7%[2]，具有明显的"二高一低"的特点：发病率高、病死率高、5年存活率低[3]。而在ⅠA期肺癌患者中，病理为原位癌和微浸润性癌的患者术后5年生存率可接近100%[4]。早期肺癌并无典型临床症状，可仅表现为CT影像上的肺结节，因此视角前移到肺结节筛查阶段，做到肺癌的早发现、早诊断以及规范化治疗可以有效提高5年生存率，减少病死率。我国遗传背景及环境差异等国情不同于欧美国家，为了确定适合我国肺癌的诊治共识，2018年中华医学会呼吸病学分会和中国肺癌联盟共同更新了"肺结节诊治中国专家共识(2018年版)"[5]，推荐使用低剂量胸部CT检查对高危人群进行早期筛查及随访。

发现肺结节后的诊疗流程，可以大致总结为FIRST方案：随访(follow up，F)、影像学检查(imaging test，I)、药物(respiratory medicine，R)、手术活检(surgery，S)、组织活检(tissue biopsy，T)等。

由于目前存在CT阅片数量激增、人工阅片耗时长、各地区医疗资源难以同质化等问题，导致出现诊断延误和过度医疗等弊端，尽早解决肺结节良恶性的鉴别诊断、早期肺癌的准确甄别及避免造成患者的过度治疗这3个至关重要的问题尤为关键，因此我们不再满足于低效检出肺结节，而是希望能够高效获取深层次更准确的信息。由于肿瘤具有空间和时间异质性，活检并不能全面评估肿瘤的性质、生物学信息等情况，因此人工智能辅助深度挖掘影像数据实现肺结节的早期诊断及精准医疗作为前述FIRST方案的完善优化成为研究热点。

本文就人工智能主要技术在肺结节早期诊断方面的应用进行综述，以期能更好地利用人工智能提高早期肺癌的诊断率，降低肺癌患者病死率并提高其生存率。

1 应用于肺结节的人工智能技术

1.1 经典机器学习

机器学习是人工智能的一大领域，是一门涉及统计学、概率论、计算复杂性理论等的交叉学科，通过设计计算机算法学习和模仿医师的诊断技术，完成特定任务。经典的机器学习分类器有决策树、支持向量机、人工神经网络等。

目前图像处理领域经典的机器学习算法主要是支持向量机，作为一种经典的线性分类器，对于肺结节良恶性分类的应用较好，只需要小样本就可找到数据之间分类的超平面，高效解决小样本数据的分类问题。

机器学习中无论是何种分类模型，要想获得较好的预测效果，都需要输入人工标记好的、标准化的数据进行训练学习，使其依赖并受限于人工标注；相比于影像组学和深度学习的过程，传统机器学习算法冗杂落后，在大数据处理方面也并不灵活。

1.2 深度学习

深度学习是机器学习领域一种新兴的框架技术，但优于传统机器学习算法，具有自动化和无缝调整性能的优势。深度学习可以直接从海量医疗影像的原始数据出发，利用由多重非线性变换构成的多级处理层自动对数据进行高度抽象的模式识别和深层特征提取。其中，卷积神经网络、深度信念网络和自编码器在肺结节诊断中应用较多。深度学习的运作机制可知性较低，目前研究人员也在致力于解释其机制。Shen等[6]提出了一种新的可解释的深层语义卷积神经网络来鉴别肺结节的良恶性，并整合语义特征于分层语义卷积神经网络模型中来预测恶性程度。

深度学习模型需要输入大量的标记过的训练数据实现高精度，小数据下的深度学习容易过拟合。迁移学习[7]的出现弱化了数据量对深度学习的限制，节约训练时间，解决了已标记的数据不足的问题，解除了有限的变量数对于机器学习和深度学习表达能力的限制。Nishio等[8]分别用计算机辅助检测与诊断系统方法、带有迁移学习的深卷积神经网络方法和不带迁移学习的深卷积神经网络方法对1236例患者影像中的肺结节、原发性肺癌和转移性肺癌进行分类，准确率分别为55.9%、68.0%和62.4%，深卷积神经网络优于传统计算机辅助检测与诊断系统，带有迁移学习的深卷积神经网络分类更加准确。与其他模型不同的是，迁移学习不是从零开始，而是把已经训练好的模型参数迁移到新模型完成新的数据集训练。

1.2.1 卷积神经网络

卷积神经网络现已成为人工智能中的革命性概念，最初是由Fukushima[9]提出，由输入层、卷积层、池化层、全连接层和分类器层组成，是一种对输入图像重复进行填充、卷积、池化操作而实现特征提取和图像降维的前馈神经网络。卷积层利用滤波器得到高层次特征映射图，减少权值参数的个数，大幅降低计算复杂度，而池化层通过执行非线下采样实现特征图像降维，简化了卷积层图像的输出，避免样本量不均衡而导致的过拟合问题。

1.2.2 深度信念网络

深度信念网络在2006年由Hinton等[10]首次提出，由若干个受限波尔兹曼机来构建多层神经网络，通过对每个受限波尔兹曼机进行训练使整个网络按最大概率生成数据。深度信念网络对数据的复杂关系有较强非线性映射能力，该算法用作数据分类、特征识别上较多。

1.2.3 自编码器

自编码器是一种非监督学习算法，由编码器和解码器组成，在编码阶段将高维数据映射为低维数据，将输入信号进行编码，再经解码阶段输出数据，完成对原始信号的复现，减少数据量。主要有栈式自编码器、降噪自编码器、稀疏自编码器等。

1.3 影像组学

2012年由荷兰学者Lambin等[11]提出了影像组学的概念，其灵感来源于肿瘤的异质性。Aerts等[12]提出影像组学能够分析肿瘤异质性，把握肿瘤关键特征，解码肿瘤表型，分析潜在基因表达类型，影像组学可以实现影像数据与生物数据的关联。

简单来说，影像组学即采用自动化方式对传统医学影像进行深度挖掘再利用。高通量地从影像中提取并分析大量的高级图像特征，构建出高维特征空间，再结合应用场景运用机器学习和统计学分析筛选出最佳特征，融合临床和基因信息构建综合模型以支持临床治疗决策。

影像组学的框架流程包括标准化影像数据采集、图像分割与重建、特征提取、特征分析及预测模型。

1.3.1 标准化影像数据采集

尽量选择标准化的入组数据，使数据不受采集设备、扫描参数如层厚、脉冲序列的影响。众多医院的数据采集质量参差不齐，保证质量的同时较难保证大样本，所以找到的入组标准与数据量的平衡点至关重要。

1.3.2 图像分割与重建

精确的图像分割是影像组学分析的基础，目前并无统一的分割标准。人工手动分割由于精确度高仍作为金标准，但是效率低，相比较于半自动化分割，手动分割还具有可重复性差的缺点；自动化分割虽没有规范标准，也难以在磨玻璃密度结节或者部分实性结节中保证精确性和鲁棒性，但较为迎合大数据趋势，对于实性结节分割效果也较精准。目前迫切需要联合工科发展高精度、全自动的分割算法。

1.3.3 特征提取

影像组学特征很丰富，定量特征提取是关键步骤，目前最常用的方法是主成分分析，通常通过无监督学习获得如直方图强度、形状特征、纹理特征如同质性或异质性、小波特征等。

1.3.4 特征分析及预测模型

建模应考虑3个方面的因素：特征的选择、建模的方法、模型的验证。为了避免模型所含特征过多导致的过拟合问题，应对特征降维，筛选稳定性好、可重复性高的数据，影像组学以外的特征例如临床信息、疗效评估、基因信息也应该纳入以实现模型的整体性；建模方法应遵循稳定和能够解决相关临床问题的原则；模型的性能是通过不断验证来校准的，可以根据受试者工作特征(receiver operating characteristic，ROC)曲线或者ROC曲线下面积(area under the curve，AUC)验证。

2 人工智能在肺结节诊断中的应用

2.1 肺结节检出

Monkam等[13]从肺部影像数据库和图像数据库资源中提取已被标记的带有3种矩阵参数大小(16×16、32×32、64×64)的13 179个微结节和21 315个非结节，设计了3个不同卷积层的卷积神经网络模型来检出肺结节以降低假阳性率，发现2个卷积层的卷积神经网络模型在32×32大小情况下性能最好，准确度为88.28%，AUC为0.87，F值为83.45%，敏感度为83.82%，结果表明具有合适的矩阵参数大小和卷积层的卷积神经网络模型能有效区分肺小结节和非结节，减少假阳性率，增加肺结节的检出率。

2.2 肺结节诊断

2.2.1 肺结节良恶性鉴别

王晶晶等[14]发现用支持向量机预测模型预测了由Curvelet变换提取的73个纹理特征，结果显示其敏感度为88.6%，符合率为78%，能在一定程度上降低肺癌早期诊断的误诊率。Gao等[15]将肺结节中的三维纹理特征、临床信息及CT图像数据计入支持向量机模型进行肺癌预测，可将放射科医师诊断的敏感度提高23%，特异度提高28%。

深度学习的算法可以快速调整，提高了准确度，改善了传统机器学习受手工预处理标记特征的限制以及手工分割的测量误差。Hua等[16]首次将深度学习技术应用于肺结节分类，利用来自肺部影像数据库和图像数据库资源的1 010例患者CT图像中2 545个肺结节，特别介绍了深度信念网络和卷积神经网络2种模型，最终敏感度为73.3%，特异度为78.7%。Lyu和Ling[17]提出由3个卷积神经网络组成的多层卷积神经网络来提取多尺度特征对良性、恶性和不确定性肺结节分类，在不添加任何手动预处理算法的情况下，该模型的准确率达到了84.81%。Shaffie等[18]利用新的吉布斯马尔可夫随机场模型提取了来自肺部影像数据库和图像数据库资源中467例患者的727个肺结节外观和几何特征，将其运用到深度自编码器进行肺结节良恶性分类，准确率达到91.20%，其局限性为无法区分良恶性结节的具体病理类型。宋尚玲等[19]提出一种基于深度信念网络的模型用于肺结节的检出，深度信念网络识别肺结节的准确率为90%，假阳性率为0.5%。

影像组学在肺结节良恶性鉴别上也有很广泛的应用。Beig等[20]收集了290例肺结节患者肺CT平扫检查影像并提取特征，将145例特征信息用于训练机器学习分级器，并结合影像组学特征获得的AUC为0.8，较卷积神经网络和医师AUC有明显优势来区分非小细胞肺癌和良性肉芽肿。

2.2.2 预测肺癌病理分型及分期

Zhu等[21]利用LASSOlogistic回归模型从129例图像中选取5个放射性标记的关键特征来构建区分鳞状细胞癌和肺腺癌的模型，验证集的敏感度达82.8%，特异度为90%，为今后详细分类病理亚型奠定了基础。Haga等[22]评估了放射组学在早期非小细胞肺癌的组织学中的作用，AUC为(0.725±0.070)，较高的预测精度意味着放射组学的无创组织学评价病理分型是一种有前途的评价方法。She等[23]提取60个放射学特征建立模型来鉴别惰性癌如原位癌、微浸润癌与侵袭性腺癌，其AUC为0.89，提示影像组学对肿瘤侵袭性的预测具有良好的应用价值。

2.2.3 预测肺癌基因表型

Jia等[24]建立了一种放射组学特征和随机森林模型结合的算法识别肺腺癌的表皮生长因子受体(epidermal growth factor receptor，EGFR)基因突变，94个放射组学特征的随机森林模型的AUC达到0.802，结合临床病史后，AUC增加到0.828，表明影像组学可以识别肿瘤的基因突变。Xiong等[25]利用三维卷积神经网络来识别肺腺癌患者CT图像中的EGFR基因突变状态，卷积神经网络在独立验证集中的AUC为0.776，与临床特征(性别、吸烟史)结合后的AUC为0.838，表明深度学习也可以识别肺腺癌的EGFR基因突变，与临床特征结合预测效能更好。

2.3 肺癌疗效评估及预后

恶性肿瘤进展迅速，实时监测病情，尽早调整最佳治疗方案是很有必要的。这需要影像学能无创地、多次实时进行疗效评估。Fave等[26]研究表明影像组学特征会随着放射治疗过程而出现显著变化，一定程度上也反映了肿瘤对放疗的反应，可用影像组学评估治疗结束时肿瘤的状态用以预测生存期。Kim等[27]利用CT的放射学特性数据来预测EGFR突变型肺腺癌患者接受EGFR酪氨酸激酶抑制剂治疗后的无进展生存期，运用临床因素模型预测的一致性指数为0.69，结合影像组学和临床因素模型预测一致性指数达到0.77，表明临床因素结合放射学特征后预测生存期价值显著增量。Dou等[28]研究了6个肿瘤周边放射学特征对预测晚期非小细胞肺癌远处转移的提示意义，比肉眼可见的肿瘤特征更有价值。

3 目前存在的问题

虽然人工智能在肺结节良恶性诊断方面已经有了很大的成就，但还存在很多问题亟待解决，这需要临床医师和工科技术人员的共同努力，实现人工智能技术的更好的医工交叉。临床医师不仅要提出临床问题、提供影像数据，还要熟悉人工智能技术的每个流程、每个参数，这样才能自主调整模型诊断复杂临床问题；工科人员也要深入临床，推进工科技术的临床化，真正了解临床医师和影像科医师所面临的亟需解决的问题，开发模型新功能、优化现有模型，做到源于临床而高于临床，能为医师所用。

目前亟待解决的问题是创立数据资源共享平台，整合多中心、多参数、多模态、多病种标准化的大数据供科学研究。数据量是最基础的，还要具备标准化及多样性，包括病理信息、基因信息、治疗疗效信息、预后信息、随访信息等多层次资料，增加信息的可重复性和算法的多样性。目前已经有不同的国际组织建立了各自的公共数据库，其中CT影像的公共数据库有肺部影像数据库和图像数据库、ELCAP数据库、ANODE09数据库。

人工智能对肺结节良恶性诊断的敏感度较高，随之而来的问题是假阳性率亦高，这需要工科技术人员及临床医师对二者分析要兼顾，优化算法，在确保一定敏感度的前提下降低假阳性率。daSilva等[29]提出了一种基于卷积神经网络的肺结节粒子群算法来降低肺结节检出的假阳性率，在肺部图像影像数据库的CT扫描中测试了该方法，获得的最高准确度为97.62%，敏感度为92.20%，特异度为98.64%，ROC曲线的AUC为0.955；结果表明粒子群算法在识别最佳卷积神经网络超参数方面有很高的性能潜力，在降低假阳性率的同时保证了高敏感度。

目前人工智能领域尚缺乏临床相关性的标准化评估，亟需一套统一的质控标准，以控制相关研究的可靠性。Lambin等[30]在2017年提出了影像组学领域的质量评分，其他的技术领域质控标准还有待制定实施。

4 展望

4.1 影像基因组学

人工智能技术走向临床需要全世界多中心、前瞻性的研究，整合影像组学与其他组学也是一大热潮。2017年Lambin等[30]再次提出应将影像组学与其他组学密切结合，如临床特征、免疫组织化学、基因组学等数据，全方面评估，有利于实现精准医疗。

目前研究较多的是整合影像与基因组学的研究，蛋白质、组织微环境、基因的改变都可以在宏观影像学上有特征性的表现，甚至这种分子水平的变化早于宏观变化几个月，于是衍生出影像基因组学。研究特定的影像组学特征与特定基因表达之间的潜在关系，将病理生理改变定位到基因层面，为构建影像基因组学模式奠定基础。

4.2 人工智能联合液体活检

近年来，表观遗传学、液体活检等新技术在肺癌早期诊断上的应用为亚临床期的肺癌个体化筛查提供了技术基础，相关的临床研究也正在进行。在中国临床试验注册中心中，检索到一项正在开展的肺结节良恶性辅助诊断中国多中心临床试验(ChiCTR1900026233)，拟入组1400例经影像学手段检出肺结节的患者，探讨循环染色体异常细胞联合影像学人工智能分析工具对早期肺癌的诊断价值。期待更多大样本、高质量的临床试验为新型肿瘤标志物及人工智能工具的临床价值提供更有力的证据。

考虑人工智能联合液体活检对肺结节良恶性辅助诊断作用目前处于临床研究阶段，故暂时不作为常规推荐的肺癌筛查手段。但相信未来几年内可以看到经大规模临床试验验证的肺癌特异性生物标志物应用于临床。

4.3 物联网技术

规范化诊治和长期有效管理肺结节及肺癌患者能够有效提高患者生存率。为了解决部分患者难以长期规范化管理诊疗的问题，物联网医学[31]应运而生，极大改善了全国各地区尤其偏远地区的肺结节诊治水平。物联网医学具备全面感知、可靠传输和智能处理等多种功能，有利于全面了解患者的病情变化，实现对高危人群在线随访、教育、疗效观察、防止肺癌术后复发转移等；对于疑难病例又不便于就诊者，也可以联合云中专家多学科会诊和随访。

综上所述，人工智能很大程度上提高了肺结节的检出效率及良恶性的诊断鉴别能力，虽然人工智能无法取代医师的决策地位，但会成为医师的得力助手，医师也应运用好新科技带来的技术革新，同时成为科技时代的影像信息学专家。无论何种人工智能，都有其自身的优点与局限性，这里引用YoshuaBengio的一段话：科学不是竞争而是合作，任何学科的发展都需要行业之间互相借鉴、博采众长，站在巨人的肩膀上不断前行，这样才会激发科学原有的活力。人工智能实现肺结节精准诊断的道路尚需探索和突破，相信在不久的将来，人工智能会在精准医疗时代有出彩的表现。

人工智能在肺结节诊断中的应用及展望

相关文章

人工智能企业

人工智能硬件

人工智能产业

人工智能技术