本文来自 品玩,作者:Decode。
摘要:归根到底,对Watson
Health来说致命的问题在于,它的诊断结果不准确。此外,Watson只能比人类专家更快地给出相同的诊断结果,而无法治疗人类医生治不了的病。
人类丰满的AI梦,正在撞上冰冷的现实。
1月19日,据报道,IBM(IBM.US)正在考虑出售 Watson Health
业务,可能的方案包括出售给私募股权公司、医疗行业企业或者与一家特殊目的收购公司(SPAC)合并。
Watson
Health部门主要负责将AI用于帮助医院、保险公司和制药企业处理数据。据报道,该部门年收入大约为10亿美元,但目前仍未盈利。
IBM在2020年4月迎来了新任 CEO 阿尔温德·克里希纳(Arvind
Krishna)。上任后,克里希纳着手简化公司业务线,让云计算在市场中变得更加有竞争力。如若Watson
Health真的被出售,对IBM的AI业务来说,无疑是一次不小的挫折。
曾想替人类解决肿瘤治疗
长久以来,Watson都是IBM AI业务的一块招牌,也是人类最初充满野心的AI梦的代表。
2011年,深度学习方法刚刚被重新定义,仍未掀起新一轮AI浪潮。但此时IBM的Watson就在美国最受欢迎的智力竞猜节目《危险边缘》中,击败了该节目历史上最成功的两位人类选手。
Watson在比赛中展现了强大的自然语音理解能力。要赢得比赛,它必须解析大量文字找到线索,然后搜索大量文本数据库,以检索可能的答案。在击败两位人类冠军后的第二天,IBM宣布了
Watson的新职业目标:一名AI医生。
从逻辑上看,Watson在竞猜节目上展现的能力,似乎可以移植到医学领域——都是先理解自然语言(患者的电子病历),然后检索文本数据库(治疗方案和最新医学文献),最终给出答案。这个方案的价值在于,每天有将近8000篇医疗文章发布,医生一篇篇读是不可能的,AI能帮助医生阅读最新医学成果。
2013年,IBM更是将研究重心聚焦于肿瘤治疗这一最大的、人类尚无法攻克的医学挑战上。2015年,IBM成立了专门的部门—— Watson
Health,可见其当时的决心。IBM前CEO罗睿兰(Virginia Rometty)曾把Watson Health称之为公司的“登月计划”。
众所周知,AI的基础是大量训练数据。为了获得这些数据,IBM花费约40亿美元收购了4家医疗领域数据驱动型公司,分别是Phytel、Explorys、Merge
Healthcare和Truven Health Analytics。2016年,成立仅两年的Watson Health,员工规模已经达到一万多人。
在重点发力的肿瘤治疗领域, Watson
Health吸引了许多著名合作机构,包括安德森癌症中心、纪念斯隆-凯特琳癌症中心、梅奥医院、奎斯特诊断公司。2016年8月,Watson
Health还进军中国,推出“健康中国”生态圈共赢计划。
声势壮大的宣传、数额庞大的并购、权威机构的合作,IBM通过一系列举措让外界对Watson
Health的预期提得非常高。毕竟,用最前沿的AI技术来解决最困难的医疗问题,这件事情听上去就非常性感。
不过,后来的发展事与愿违。安德森肿瘤中心曾与 IBM
合作,为肿瘤学家创建咨询工具。该工具利用自然语言处理技术来汇总患者的电子健康记录,然后匹配数据库提供治疗建议。安德森癌症中心在这个项目上投入了6200万美元,但最终结局却是双方在2017年2月终止了合作关系。
业界开始对Watson Health产生怀疑,它自己的问题也接踵而至。2018年5月,美国媒体The Register报道,Watson
Health部门要解雇大约50%-70%员工,引发了巨大震动。不过后来科技媒体IEEE
Spectrum的报道指出,被裁员工主要来自收购的三家公司Phytel、Explorys和Truven。大量收购使得公司面临人员臃肿问题,为裁员埋下了伏笔。
但这些都是表面现象,归根到底,对Watson Health来说致命的问题在于,它的诊断结果不准确。
2018年8月媒体报道,没有任何已发表的研究表明,Watson提升了患者的治愈率。有十几位使用过该系统的机构和医生反馈,其癌症应用收效甚微,某些情况下还会出错。并且,由于缺乏罕见病例数据,Watson的更新速度跟不上癌症治疗的发展速度。
丹麦一个医院在一份研究中指出,Watson给出的诊断方案,与专家给出的仅有30%重合度,因此拒绝采购Watson系统。德国媒体也曾报道,德国两家机构在实际应用中发现,Watson对于那些症状特殊的病人会开出致命药物。2018年10月,IBM
Watson Health当时的CEO Deborah DiSanzo宣布离岗。
一切都不可逆转地指向最终结局,如今终于传出IBM寻求出售Watson
Health的消息,失去业界的信心,再丢掉雄厚资金的支持,这个人类最早的AI明星的前景,不再明朗。
AI梦该醒了?
当前AI应用于医疗最普遍的场景是识别医疗影像,比如视网膜眼底影像。而Watson所挑战的是诊断问题,并且还是医学上难度最大的肿瘤治疗领域。在该问题上,Watson
Health面临着数据和AI智能的双重挑战。
在数据获取层面,大部分医疗数据是非结构化信息,比如医生撰写的病历和出院总结。虽然AI的自然语言理解能力进步飞快,但相比人类依然差很多。图灵奖得主约书亚·本希奥(Yoshua
Bengio)曾表示,在医学文本文档中,AI无法理解歧义,也无法找到人类医生会注意到的细微线索。
另一方面,有些罕见病例的数据往往难以获取。《中国工业和信息化》杂志2020年的一篇文章指出,在解析Watson的数据中发现,在罕见病例研究中,本来应该喂给Watson大量的真实数据从而找到新的治疗手段,由于罕见病例数据的极端匮乏,实际上Watson被灌了一堆没什么用的假想数据,而并不是真正的病人数据。这种通过假想数据学出来的AI,准确性可想而知。这就出现了罕见病例中Watson的误诊情况。
全球领先的医学资讯平台Medscape在2018年一篇报道指出,Watson在学习根源上有问题 ——
它并没有使用足够的真实病例进行学习,而负责训练它的人群,仅仅是纪念斯隆-凯特琳癌症中心的肿瘤学家和IBM自己的工程师。Watson大量训练时间用于掌握上述肿瘤学家设计出的理想化病例和治疗方案。它用于训练的真实病例数量很小,最多的肺癌也仅有635例,最少的卵巢癌更是仅有106例。
IBM在数据获取上曾做过努力,花费40亿美元收购了4家公司,但在数据融合上,IBM低估了复杂度。上述《中国工业和信息化》杂志文章指出,IBM前员工和前客户的医院管理人员说,虽然收购了大量数据,但在融合各种各样的数据时发现需要花费难以想象的人力物力,还没开始训练,就让人筋疲力尽。在巨大的经济压力和暗淡的前景面前,各个合作伙伴只能选择终止合作,留下一个烂尾楼。
AI目前的智能程度,更是难以匹配肿瘤治疗的复杂性。AI的本质是统计学,它所得出的结论局限于人类训练员提供的数据,而无法像一个专业医生一样,独立生成新的见解。
也就是说,Watson只能比人类专家更快地给出相同的诊断结果,而无法治疗人类医生治不了的病。
在巨大的风险面前,医生只会将Watson的诊断结果作为参考,依然会进行大量临床研究。在IBM的宣传中,Watson能够凭借着强大的计算能力发现人类看不到的模式。但事实证明,AI的智能远未到这个程度。Watson对医生的意义,也就大打折扣。
Watson
Health的挫折反映出AI应用在诊断上困难重重,但这并不意味着AI在医疗领域没有前景。在图像分析、基因分析和制药领域,都有不少公司在探索AI的应用场景。即使是在诊断领域,IBM的Watson没做好,也不意味着其他人做不好。至少,后来者可以在Watson上学到一些经验。一名中国AI医疗企业的创始人就对品玩说,无论AI领域创业者,公司还是投资人,都在变得务实,按今天AI与医疗的现状,与其一上来就瞄准高精尖问题,倒不如先用自己的技术解决一下医院院长的痛点。这样自己的公司也能活下去,AI也真的能体现点价值。
(编辑:马火敏)