4月15日,北京邮电大学引进的优秀人才王光宇老师(特聘研究员、博导)在顶级国际学术期刊《自然》子刊 (Nature Biomedical Engineering)在线发表文章——《研发真实世界场景下肺部疾病的通用智能识别框架》,并推出全球最大规模的胸部X光片数据集,提出了基于X-ray影像的肺部疾病通用智能识别框架,并对肺炎进行检测和严重程度评估。此智能系统通过了多中心、真实世界场景的临床验证,并且在新冠肺炎的智能分诊的科技应对疫情过程中发挥作用。此项工作的代码和数据集发布到了国家生物信息中心云平台,是目前世界上最大规模的高质量X光片数据集,希望进一步推动信息领域与生物医学的创新交叉研究工作。
本论文由北京邮电大学联合清华大学、中山大学、四川大学华西医院等国内外多家机构合作完成,其中王光宇老师为第一作者及通讯作者,北京邮电大学是第一完成单位,这也是我校首次以第一单位在《自然》子刊 (Nature Biomedical Engineering)发文。
图1.真实世界场景下肺部疾病的通用智能识别框架
目前,基于数据驱动的人工智能方法在医学影像的领域中不断突破。然而在复杂、开放的真实场景下进行临床验证时,仍存在诸多挑战。尤其是在新冠疫情期间,各国的计算机科学家们发布了上千种机器学习算法,认为这些算法能根据胸部 X 光片、CT 图像诊断或预测新冠肺炎。然而剑桥大学Michael Roberts的另外一项研究发现,由于算法偏见和不可重复性等问题,科学论文和预印本提到的相关机器学习算法很少具有潜在的临床应用价值。
为解决智慧医疗场景中所面临的这些挑战,团队从鲁棒的AI框架设计、高质量的数据集构建,多中心临床验证等层面开展深入的研究工作,并经过了严格的同行评议过程。王光宇博士对上述研究成果在Nature Portfolio Community 以《Building an intelligent diagnosis system for the real-world clinical applications using chest X-ray images》为题发表评论文章。国际著名的智慧医疗专家Eric Topol称这是“One of the best the best studies of deep learning #AI for aiding the diagnose of pneumonia… among hundreds that have been performed to date”。
具体地,对放射科医师来说,要在胸片上发现肺炎并进一步鉴别诊断是很困难的。尤其在疫情期间,影像是重要的辅助诊断工具。相较在标准实验室里进行的分子检测,X-ray扫描的速度快,也能更直观地观察到肺部的病理学特征及变化。开发智能影像AI系统可以帮助放射科医生和医生进行快速诊断并预测危重等级,这在医疗系统超负荷的情况下具有尤其重要的临床应用价值。在方法层面,研究团队提出了基于胸部X-ray图像的通用处理框架。由于X-ray拍摄容易出现扭曲、变形、饰物遮挡等问题,通过关键点检测,智能矫正和肺部-病灶分割等模块,可以将X-ray图像进行自动的预处理和标准化。此外,临床影像报告的叙述中包含许多身体部位和健康状况的关键信息,是临床诊断和疾病治疗证据的主要组成部分。我们基于影像报告,通过自然语言处理(Natural language processing, NLP)技术抽取了影像发现(Radiologist findings)和疾病标签,包括肺炎、胸腔积液、肺肿块等等。由于同一张X-ray影像中多种影像发现/疾病常常并存,研究团队设计了新颖的多标签分类模型,可以对临床场景下的肺部疾病进行精准识别。最终,该智能识别系统经受住了真实世界研究的考验--在来自4个队列的不同临床场景,及多国家的数千张外部影像数据上,进行回顾性和前瞻性测试均具有良好的泛化性能。
图2. AI系统辅助临床流程
在这项工作中,科研团队采用了多源多中心的14万张胸部X-ray图像构建了深度学习系统。这是国内乃至世界上最大规模的多临床场景胸部X-ray影像数据集。已有的开源胸部X-ray数据来源于国外住院人群,如斯坦福大学的吴恩达团队发布的ChestX-ray14。相比较于已有开源数据集,我们这个数据集包括了多种临床真实场景和人群,如住院、门诊、体检。比如,其中的体检数据集包含大量健康数据,门诊包含不同肺部异常的轻症患者,可以供研究者对健康人群建模,构建疾病异常检测AI系统。该研究数据集已经通过国家生物信息中心平台发布,以协助来自不同国家和地区的研究团队和临床医生开展研究。
王光宇老师入职后发挥其本人的医工交叉领域综合优势,以5G技术为内核,针对全场景的综合智能医疗健康应用整合多种新兴技术,解决当前利用人工智能技术在临床真实世界研究中的重大挑战,致力于取得重要技术和理论突破。如,在科技抗疫中实行了新冠病毒性肺炎的智能诊断及重症预测技术,引领了全球在这个方向的创新研究;开展面向多源异构的医学电子病历的跨医院、跨科室的信息智能抽取等重大技术挑战的研究,相关成果已经发表在国际顶级期刊与会议上。
王光宇老师是信通院引进的A类优秀人才,隶属张平院士团队。张平院士团队作为我国网络通信领域的优势团队,面向国家战略需求和交叉学科发展需要,凝聚多学科力量,开展信息科学前沿交叉研究,在工业互联网、智慧医疗“新基建”及培育我国经济发展的新动能方面正不断做出重要贡献。
文章链接:https://www.nature.com/articles/s41551-021-00704-1
402am·永利手机版
2021年4月28日