“把脑袋对准这个镜头,伸出舌头,拍张照就好了。”简单三个步骤过后,你已经完成了一次胃癌高危人群筛查。胃有没有罹患癌症的风险,通过观察舌头就能判断,在过去听来是件不可思议的事。最近,浙江省肿瘤医院和西湖大学杨林实验室联手,做了一个大胆的尝试——开发了基于舌象的胃癌诊断新技术,将中医舌象判断与临床的胃癌诊断筛查联系起来,相关研究成果登上了国际顶尖医学期刊《柳叶刀》杂志的子刊《电子临床医学》。在浙江省肿瘤医院中西医结合科实验室里,记者看到了一台便携式舌象采集分析仪,通过舌像筛查胃癌的奥秘就藏在这小小的机身里。
舌像里的奥秘胃癌,是全球范围内第五大常见的恶性肿瘤。据全球癌症统计数据(GLOBOCAN)估算,2020年,胃癌的发病人数为108.9万人。所以,人类还将和这一顽疾长期对抗。许多人不知道的是,胃癌还是一种亚洲性疾病,在大多数国家并不是一个高发病种,国际上的相关研究进展也因此相对缓慢。每年,浙江省肿瘤医院大约收治1500例的胃癌患者,早筛查、早诊治能够显著提升胃癌患者的生存率,但是许多患者前来就诊时已经错过最佳治疗时机。怎么样能把胃癌筛查提前一点,更精确一点?中西医结合背景下的临床医生们一直在思考。老中医有四个法宝,“望闻问切”。其中,“望”字包括了舌诊,也就是通过观察舌头的色泽、形态来辅助诊断。中医学认为“舌为脾之外候,舌苔由胃气熏蒸而成”,可见舌象与脾胃关系最为密切,其变化也能客观反映胃部健康状态。浙江省肿瘤医院党委书记程向东教授在胃癌诊治领域深耕几十年,对比胃癌患者与非胃癌患者的数据,他发现胃癌患者的舌象极有特点,比如患者的舌苔呈现厚腻、干燥的状态,舌下脉络的淤阻情况比较严重。其实,这是由于舌苔上多种微生物的丰度差异导致的。现代科学研究表明,口腔微生物与胃炎、肝癌、结直肠癌等疾病相关,舌象和舌苔的样貌变化正是能够透视内里脏器情况的一个窗口。“传统的胃癌筛查手段主要为胃镜,这不仅对医疗设备和人员的要求多、成本高,还需要侵入患者体内,很多患者都害怕做胃镜。”浙江省肿瘤医院中西医结科副主任中医师袁莉说,如果是利用常规血液肿瘤指标的筛查,检出率不高,也很难识别早期患者。那么,通过AI识别舌像筛查胃癌就靠谱吗?2020年初,程向东团队搜集的第一批舌像数据传送到了西湖大学。在杨林教授组建的人工智能与生物医学影像实验室里,AI向老中医拜师,以中医舌象理论为逻辑基础,开启了这场深度学习。这一批数据由国内10个医学中心招募的937名胃癌患者和1911名非胃癌参与者组成,另外选取其他7个医学中心的815个数据样本进行独立外部验证。“经过内外部验证,三种基于舌象的AI模型——APINet模型、TransFG模型和DeepLabV3+模型对胃癌诊断结果的准确性非常高”,袁莉说,“这也让我们看到了初步的可能性。”在袁莉看来,中医诊断是对疾病信息的提取,“望闻问切”就是一种提取方式。在这种信息收集过程,单靠人工方式不完整也不规范,如个人脉搏不同、医生压指的力度不同等等都会造成影响,同样,从中医角度看舌像也具有一定的主观性。AI能做的首先是排除这些人工误差,以更系统、完整的方式提取信息。对它来说,做出的判断有多准确,取决于它学习了多少数据样本。于是,浙江省肿瘤医院研究团队开始了更大规模的数据收集工作。袁莉告诉记者,他们开始与全国50多家医院合作,扩大样本数量和范围,一个5到10万大队列人群的胃癌筛查计划也正在酝酿。
“好学”的AI从采集好图像到输出结果,AI大约只需要0.1秒的时间。短短的0.1秒内,它的“脑”内发生了什么?西湖大学2020级博士生张士川也是这项研究的共同第一作者。他告诉记者,其实这是一个根据舌象图像建立概率模型的过程。“收集到的舌象图像由很多像素组成,我们首先要做的是将其转换成为计算机可以识别的信号矩阵,进行标准化处理。”张士川解释,在这一过程中,一张图像将被分割成784个预处理的小分区。接下来,AI会开始“识图”,在小分区内、分区之间找寻胃癌患者与舌像之间的联系。这也正是这个模型突破传统“识图”方式的创新所在。经过西湖大学杨林团队改进的新型诊断模型组合——APINet模型、TransFG模型和DeepLabV3+模型,将视野缩小到了局部,这意味着它们能够更迅速地捕捉到这些细微的差异。最终,模型将输出一个概率数值标准,即机器判定一幅舌象图像为胃癌的参考数值。成千上万次的自我学习后,再遇到新的舌象图像时,AI模型就可以生成每张舌象的胃癌概率,为医生提供参考。“AI+医学影像”的组合,倚赖的是计算机视觉分支中一类经典的人工智能任务——图像处理。也就是说,利用人工智能算法对图像进行处理和分析,让计算机能够像人脑一样,去辨读深藏医学图像中的细微信息。原先,这些重复性和强度高的工作都由医生承担,现在“好学”又“训练有素”的AI能够胜任。计算机的理解模式是和人类很相似的,不同的是,它们永远不知疲倦。最近,杨林团队还忙着给AI诊断模型升级。“一方面我们想让AI输出的结果具有‘可解释性’,也就是说当就诊者拿到自己的报告时,不仅仅有患胃癌的概率,我们还从多个方面进行解读,帮助他理解这个结果。”张士川说。另一方面,他们希望提高模型的稳定性和适应力。“如果一个新的医院需要用我的模型,但模型没有见过这些新的数据,其实是一个非常有挑战的问题。”张士川说,新医院可能存在一些不一样的参数,比如成像环境上有变化,或者图像中的污点,这些都可能对模型性能带来波动。除了辅助医生进行胃癌诊断筛查,AI还可为的空间还很大。宫颈癌的病理图像、与血液病有关的血细胞成像……在团队看来,人工智能可以成为人类的另一只“眼”,潜入人类疾病的茫茫深海,求索许多攸关人类生命健康的难题的破译密码。