https://doi.org/10.1093/annonc/mdy166
这是科学家们首次表明, CNN作为人工智能或机器学习形式比有经验的皮肤科医生更能准确诊断皮肤癌。
关于CNN
CNN是一种人工神经网络,它的研发灵感来源于大脑中神经元相互连接并对眼睛看到的东西做出反应的启发。CNN能够从它“看到”的图像中快速学习,并从它所学的知识中自学提高其性能,这一过程也称为机器学习。
这项研究的第一作者,德国海德堡大学皮肤科医师Holger Haenssle教授解释说:“CNN的工作原理就像一个孩子的大脑。为了训练它,我们向CNN展示了10万多幅恶性和良性皮肤癌和黑痣的图像,并指出每幅图像的诊断。CNN通过每一幅图像的训练提高了区分良恶性病变的能力。”
“培训结束后,我们从海德堡图书馆创建了两套未被用于培训的测试图像(CNN对此一无所知)。接着建立一组300幅图像来单独测试CNN的性能。在此之前,选择了100个最困难的病变来测试真正的皮肤科医生,并与CNN的结果进行比较。”
图片来源:conceptsrise.com
CNN对战皮肤科医生
来自世界17个国家的58位皮肤科医生受邀参加了这项“对决”。其中17人(29 %)表示他们在皮肤镜检查方面的经验不足两年,11人(19 %)表示他们拥有2至5年的经验,30人(52 %)表示他们拥有5年以上的经验。
首先,皮肤科医生被要求从皮肤镜图像(I级)诊断恶性黑色素瘤或良性痣,并给出治疗对策(手术、短期随访或不需要采取行动)。然后,四周后,他们会得到关于患者的临床信息(包括年龄、性别和病变位置)和相同100例(II级)的特写图像,并再次要求诊断和治疗决策。
在I级测试中,皮肤科医生平均准确检测到86.6 %的黑色素瘤,并且正确地识别出平均71.3 %的非恶性病变。然而,当CNN调节到与医生相同的水平时,可检测到95 %的黑色素瘤。在II级测试中,皮肤科医生改善了他们的表现,准确诊断出88.9 %的恶性黑色素瘤和75.7 %的非恶性病变。
尽管当皮肤科医生在II级获得更多临床资料和图像时,他们的诊断性能得到了提高。然而,与此同时CNN仍在努力超越医生的诊断能力。另一方面,专家皮肤科医生在I级表现比经验较少的皮肤科医生更好,并且在恶性黑色素瘤的检测方面更好。然而,他们平均作出正确诊断的能力仍然比CNN要差。
Melanoma in skin biopsy with H&E stain — this case may represent superficial spreading melanoma. Credit: Wikipedia/CC BY-SA 3.0
CNN未来运用方向
恶性黑素瘤的发病率正在增加,估计全世界有23.2万个新病例,每年约有55 500人死于这种疾病。如果及早发现,这种病是可以治愈的,但许多病例确诊时已经进入癌症后期。
Haenssle教授说:“近20年来,我一直致力于改善黑色素瘤早期检测的研究项目。我和我的团队专注于无创技术,例如,在进行皮肤癌筛查时,这些技术可以帮助医生避免错过黑色素瘤。而当我看到最近关于深度学习算法在特定任务中优于人类专家的报告时,我立刻知道我们必须探索人工智能算法来诊断黑色素瘤。”
“CNN诊断遗漏的黑色素瘤较少,这意味着它比皮肤科医生更敏感;它误诊为恶性黑色素瘤的良性痣较少,这意味着它具有更高的特异性;这些发现将减少不必要的手术。”
需要指出的是,研究人员并不认为CNN会取代皮肤科医生诊断皮肤癌,但它可以作为一种额外的辅助手段。
“CNN可以帮助参与皮肤癌筛查的医生决定是否对病灶进行活检。大多数皮肤科医生已经使用数字皮肤镜系统对病变进行成像和存储,以便记录和随访。然后,CNN可以简易快速地评估存储的图像,以获得关于黑色素瘤概率的‘专家意见’。我们目前正在计划前瞻性研究,以评估CNN对医生和患者的现实影响。”
一些局限性
这项研究有一些局限性,包括皮肤科医生是处于一个人工环境中,他们知道自己并不是在作“生死”的决定;测试集不包括全部皮肤损伤;非白种人皮肤类型和遗传背景的有效图像较少等。
他们还强调,在AI成为临床标准之前需要解决的一些问题还包括难以在手指、脚趾和头皮等部位成像一些黑色素瘤,以及如何训练AI充分识别非典型黑色素瘤和医学尚且未知的黑色素瘤等。
“目前,没有什么可以替代彻底的临床检查。但2 - D和3 - D全身影像已经能够捕获约90 %至95 %的皮肤表面,且鉴于成像技术的指数发展,我们设想自动诊断迟早将改变皮肤病学的诊断范式。然而,在将这一技术安全应用到常规临床护理前,还有许多工作要做。”作者们总结说。
责编:浮苏
参考资料:
Man against machine: AI is better than dermatologists at diagnosing skin cancer