原标题:多病种AI能够改写医疗人工智能时代吗? 多病种人工智能的审评审批为何如此困难
2020年,沈思(化名)带着团队与国家药监局开了一场临时评审会,探讨一款创新的包含三个眼底病种的辅助诊断AI。会上一下子来了30个专家,其中有审评方人员告诉沈思:这是他们有史以来见过的最为复杂的产品。
“我们现在获批的AI都是单病种AI,即一个AI能够处理一个病种。这样的AI在临床试验时相对比较容易,需要处理的相似病例可能只有一种。但要做多病种AI,临床试验的问题就变得复杂起来,不仅需要我们对每一个单病种AI进行验证,还需要验证两个病种的交集部分与两个病种的都不存在的部分。”沈思解释道。
“这时,相似病例与排他病例会变得特别多,把近90%的眼科疾病都覆盖了进去。”
现有的监管程序并不适用于这样一款复杂的医疗器械。为了将审评审批进行下去,沈思团队与药监局一同开始了多病种AI的监管流程探索。从无到有,两拨人花了整整两年的时间。
2022年9月1日,团队的眼底病变眼底图像辅助诊断软件终于获得了NMPA颁布的三类证,拿下国内首个多病种AI三类证,在国内AI的注册准入史中写上了“里程碑式”的一笔。
唯一的遗憾来源于覆盖的病种。与最初的计划相比,此次批下来的三类证仅留下了糖尿病视网膜病变、青光眼两个病种。
除沈思背后的百度灵医智惠外,国内联影智能、致远慧图、鹰瞳科技也已在多病种AI的审评审批上有所建树。众多头部企业发力的多病种AI,能够改变医疗人工智能时代吗?
多病种人工智能的审评审批为何如此困难
如果无视软件的安全性与可解释性,只是制造一个合理的算法对影像进行概率上的判别,足够数据量的深度学习训练下,大部分企业都能给出一个较为不错的结果。但循证医学需要证据,黑盒之下,我们无法得知结果如何产生。
沈思告诉动脉网:“大数据下AI给出的部分概率确实能够一定程度反映征象与病症之间潜在的关联可能,但这些关联仅是统计学上的关联,算法得出结论的过程本身不可解释。需要强调的是,AI首先是一个医疗属性的产品,也就是说,如果你只是通过算法计算一个概率,这个概率医生诊疗路径无关,那么这样的人工智能便难以通过审评审批。”
前文已经提到,多病种AI的临床试验设计是一个复杂的过程。譬如,多病种AI(以N=2为例)在进行数据集构建与算法验证时,不仅需要构建病种A数据库与病种B数据库,还需要构建A∩B数据库,并需在模型之中添加医学知识,使其能基于医学原理解释交集数据的概率得出过程。
当病种数量较少时,构建融合数据库的难度尚且可控。而在当前审评审批逻辑下,病种数量一旦增多,各病种组合的样式及需要的数据集丰富程度则迅速上升,整体呈指数趋势。
对于一个企业而言,依靠堆砌人力或许能够拼凑出多病种AI验证过程中需要的算法,但在构建完整的数据集方面,研发者将面临一些难以解决的现实难题。譬如,糖网病变的0期、6期患者数据天然较少,企业很难在真实世界中找到满足验证数据集要求的数据量。若将病种的组合考虑在内,相关数据收集复杂程度将极速扩增,最终变成一个现实之中无法解决的难题。
多病种AI如何突破“多病种”
尽管多病种AI面临无法落地的难题,但面对理想之中的AI对于人类特定能力的极致复刻,创造一个媲美放射科医生的AI依然是众多企业追逐这项技术的最终目的。
从理论上讲,多病种AI的实际应用价值、研发难度与覆盖病种数量呈指数关系,不同覆盖量下的算法在各方面均存在天壤之别。只有当N足够大、覆盖的大通量疾病足够多,能够处理多模态融合影像时,AI的价值才能向医生趋同。
在这条路径上,如何选择多病种AI作用的对象,如何确定多病种AI病种的数量,企业必须做出细致考量。
回顾国内企业在多病种AI上的突破,目前各大医疗器械监督机构总计批准两张多病种AI三类证,一张是百度灵医智惠新近拿下的眼底多病种AI三类证,包含糖网病变、青光眼两种可诊断疾病,一张则是联影智能于2020年在CE获得的胸部多病种AI辅助诊断产品,包含肺炎、肺结节、胸部骨折三个病种。除此之外,致远慧图的多病种眼底影像辅助诊断软件自2020年进入创新医疗器械通道之后仍处于审评审批中,该模型总计包含了13个种疾病。
鹰瞳科技的眼底多病种尚未披露审评审批消息,但其科研成果也有所披露。2022年7月,首都医科大学附属北京同仁医院副院长魏文斌教授团队与鹰瞳科技、爱康集团在《美国医学会杂志》子刊JAMA Network Open杂志(IF=13。4)联合发表题为“Artificial Intelligence for Screening of Multiple Retinal and Optic Nerve Diseases”的研究论文。
研究结果显示,基于眼底照片训练的AI算法模型在全国多中心的真实世界验证中,对10种常见眼底病筛查的敏感度堪比资深眼底科专家,且筛查用时节省了约75%。该试验一定程度验证了视网膜(眼底)影像人工智能多病种诊断算法能力和应用价值。
综合讨论上述4个多病种人工智能。联影智能拥有唯一一个服务胸部CT影像的人工智能,而其余三个均是围绕眼底影像展开,这两个病种拥有最为丰富的数据,最悠久的发展历史,因而在多病种时代的开端走在了最前列。
不过,病种的数据量可以说明人工智能企业在策划多病种AI研发时选择的发展方向,但要将其转化为产品,更具决定性的因素是多病种AI包含病种的数量。
两个通过了监察机构审评审批的多病种AI均有其鲜明特征。胸部多病种AI包含的肺炎、肺结节、骨折征象各异,人或机器均能轻松通过视觉进行分辨。另一方面,肺炎、肺结节、骨折各自的单病种AI较为成熟,研发、临床试验难度相对较低。因而该产品在2020年便已获得CE认证。
百度灵医智惠的眼底多病种AI同样存在区分较为简单的征象,且眼底数据获取成本、难度较低。此外,该多病种AI涉及的病种仅为两种,临床试验复杂度都仍处于可控的范围。相比之下,鹰瞳科技的“10病种”AI与致远慧图的“13病种”AI虽同样攻坚眼底疾病,但由于其涉及病种数量过多,临床试验设计难度极大。
对此,有专家表示:“尽管有多病种AI进入了创新医疗器械审评审批绿色通道,但要在现行医疗器械审查制度之下完成审批,基本上不可能实现。因此,要突破临床试验这个环节,企业必须与器审中心共同探索新的审批路径,这可能需要很长时间。”
综上所述,多病种人工智能仍处于发展初期,获证偏向于投身通量较大、单病种AI较为成熟的领域,且均严格控制了覆盖病种的数量,避免承担在研发之中产生无效投入的风险。而对于覆盖病种数量较多的AI,由于缺乏可解释性,此类AI仍需进行审批路径上的创新。
研发多病种AI值得吗?
多病种AI的研发过程漫长而艰难,但其价值是否能够匹配企业的投入呢?答案目前并不确定。
一种相对简单的方式是将其与单病种AI进行对比。医生阅片时通常会对影像数据显示的各类征象进行全面分析,而单病种AI只能对影像中的某一类征象进行分析,因而只能在特定场景之下使用,更多的价值在于辅助医生降本增效、查漏补缺。
多病种AI的价值需要视N的数量而定。对于N较小、征象差异较大的多病种AI,它的能力与多个单病种AI结合作用时的准确率差异不大,很多产线较为丰富的人工智能同样将其融合了多个单病种AI产品的平台称之外多病种AI。因此,当N较小时,多病种AI较单病种AI的辅助诊断上的优势较为有限。
再看研发难度,多病种AI要在临床中发挥有效作用,既需要对每一个包含的病种进行研究,使其具备等同于多个单病种AI的诊断能力,又需要保证在复杂病症下,得出包含多个疾病诊断的结果足够准确且不会相互排斥。因此,多病种AI的研发以单病种AI能力为基础,整体研发难度大于等于多个单病种AI,当N较小时,多病种AI在效益上不具备过多的优势,而当N值足够大,覆盖的患者数量足够多,有能力处理多模态数据时,多病种AI的价值将与单病种AI迅速拉开差距。
不过,较大N值的理想状态其技术难度与审批难度过大。当下,多病种AI带来的创新绝大多数谈不上技术层面的创新,而是商业模式上的创新,用于压缩了医疗机构购置医疗AI的成本。此时,多病种AI与单病种AI的关系也并非替代关系,而是协同赋能的关系,用智能化手段打通每一个医疗场景。
具体而言,目前单病种AI的主要落地场景仍是医院,因其价格与功能上的限制,医疗AI的购置方多为三级医院。毕竟,基层医疗、体检中心等机构的功能在于“筛防”,单个AI显然很难完成这一任务,同时购置多个AI又太贵。在这种情况下,多病种AI便可成为单病种AI的补充,给予基层医疗机构一个价格相对便宜、覆盖面相对较广的选项。
当然,由于审查过程中包含了单个病种的诊断能力,多病种AI从理论上讲亦可落足于医院这一关键场景,与单病种AI开启市场竞争。只是当下缺乏成熟的物价准入,尚无实际数据对这一模式进行支持。
我们距离理想的多病种AI时代还有多远?
诚然,当前阶段的多病种AI仍面临重重困难,并不具备改变时代的能力。但从长远的未来看,多病种AI乃至全病种AI将是医疗AI发展的必然。
那么在这个阶段,医疗人工智能企业要发展多病种AI,可能不应将多病种AI作为研发的核心。
作为国内首个获得多病种AI注册证的企业,联影智能在此后的两年并没有急着加速多病种AI的研发,而是选择完善“全栈”解决方案的打造,让其AI尽可能覆盖更多的病种与流程。
对此,联影智能某位高管在过去的采访中表示:“单病种AI与多病种AI都服务于临床需求,且多病种AI需要单病种AI最为支撑。目前人工智能发展覆盖的领域有限,要在未来更多的发展人工智能,还需要打下更为牢固的地基。”
至于联影智能如何选择AI研发路径这一问题,他用四个成语概括了联影智能的选择原则。当下,企业现在还是会更多的把重心放在“草里寻针”与“视而不见”上。具体而言,前者指许多疾病在影像学上很不易找见,如钼靶里小的钙化点、磁共振中大脑里的转移瘤,这些应用会热得最快;后者指当人眼在专注一种病症时,往往容易忽视另一病症,如乳腺增强磁共振扫描,需要对时序图像进行柔性配准,然后对造影剂的变化进行复杂的量化分析。而这些人眼“看不见的东西”正是AI可以大有作为的场景。
“雾里看花”,即有些病症影像学表现不明显,譬如病灶由于其他物体的遮挡而若隐若现,似有似无;“捕风捉影”,即模仿医生根据零星的患者信息,基于影像或者影像之外的各种临床信息,做出一些睿智的猜测、判断和决定。这种应用场景要格外小心。对于这两类场景,虽不是联姻智能当前的重心,但也会在审慎考虑的基础上进行一定程度的探索。
总的来说,多病种AI虽脱离于单病种AI的审评审批程序,但却极度依赖单病种AI的研发支持。从上述四个方向之中我们不难看出理想多病种AI乃至全病种AI的形态——这将是一个能够综合多个模态信息进行决策,能够同时处理多个诊断路径的综合体。
显然,我们距离理想中的AI仍太过遥远,但现有的AI仍处于快速发展中,不断优化当下的医疗体系。面对未来不必过多担心,毕竟,当前的成就没能让所有人都停滞,总有探索者沿着梦想的路径不懈努力。