今年11月,吳恩達領導的一支斯坦福團隊發布了一項將深度學習應用到醫療領域的成果。
當時,他們設計出了可以用來檢測肺炎的“ CheXnet ” 算法,這種算法是一個 121 層的卷積神經網絡,能夠通過胸部 X 光片判斷病人是否患有肺炎。據該團隊的描述,CheXnet 的水平已經超越了專業的放射科醫師。
這個引人注目的成果在近日引起了一位放射科學者的質疑,那就是來自澳大利亞知名學府阿德萊德大學的 Luke Oakden-Rayner。這名在讀醫學博士生,曾發表過多篇醫療人工智能方面的文章,包括曾以第一作者的身份于今年 5 月在 Nature 上發表利用深度學習等技術預測人類壽命的文章。
Luke Oakden-Rayner 對 CheXnet 的質疑主要來源于該算法所使用的 ChestX-ray14 數據集(ChestX-ray14 是目前最大的開放式胸透照片數據集,由美國國家衛生研究院發布, CheXnet 使用了ChestX-ray14 作為訓練的數據集)。他發現,與人類醫生的視覺評估相比,該數據集中的標簽不準確、不清楚,并且經常描述醫學上的次要發現。“我認為,這些標簽無法匹配圖像中顯示的疾病”,他在博文中寫道。
同時他也認為,找到精確的數據集或正確的標簽,進而讓機器高效地執行醫療任務是非常困難的。
目前,吳恩達團隊并未公開回應這一質疑。而這件事反映的數據問題也只是現階段把 AI 應用在醫學影像上“九九八十一難”中的一難。
跑鞋的漏洞
站在人工智能的起跑線上,誰擁有更多的數據誰就有了更好的跑鞋。與其他大部分傳統行業相比,高度注重信息化的醫療行業無疑有不少“跑鞋”,而在醫療行業中,性能最好的“跑鞋”又屬醫學影像數據。
畢竟,對于以數據為最基礎食材的人工智能來說,沒有什么比醫學影像數據更好咀嚼:在醫療大數據中,超過 80% 的數據來自于醫學影像,人工智能可以借助這些海量數據去生成算法模型,這保證了模型最大的包容性。
醫學影像數據尤其適配基于深度學習的圖像識別技術。現在,深度學習是應用最廣也最為成熟的人工智能技術之一,其進步最快的領域之一就包括圖像識別。利用數據量以及計算量作為模型驅動力,卷積神經網絡(CNN)以及深度神經網絡(DNN)等深度學習算法已經超越傳統方法的圖像識別性能,我們甚至頻頻聽到 AI 不斷逼近甚至刷新人類醫生的水平的消息。
來自中國國家癌癥中心的高亦博教授則認為,目前所謂的人工智能解決的都是非常明確具體、基本屬于一步式的判斷任務,它還不具備類似人腦的高度適應各種具體問題的能力,而影像診斷中每一個分辨步驟都已經非常清楚,因為大夫在讀片時也是分步驟有規矩的。
“在醫學影像上使用 AI 有兩個天然優勢,一是我們可以把診斷的思考過程明確地分解為若干步驟,二是醫學影像的識別結果可以很容易地實現兩分法,即有腫瘤還是沒有腫瘤,或者這個腫瘤是良性還是惡性,這樣的任務容易用當前流行的深度學習、神經網絡進行處理”,高亦博教授對 DT 君解釋道。
很明顯,在 AI 與醫療場景的結合中,基于深度學習技術的醫療影像的識別與分析,是目前最有希望在整個醫療領域中率先進入大規模應用階段的。這一點同樣得到了醫療界的認可,北京大學人民醫院放射科原主任杜湘珂教授就在北京大學醫學部影像醫學學系第二次學術年會上表示,她感受到 AI 跟影像專業居然有這么密切的相關性。
“在所有的數據里,影像的數據跟臨床病理比較起來,它的標準化、格式化、統一性是最強的。說實在的,目前的病理數據仍然過于凌亂,無法與數字影像數據相比”,她說,“人工智能幾乎無處不在,你問問所有的放射科大夫,放射科主任都會跟你說,我們也在跟 AI 合作,某某公司在找我們”。
但盡管有了好“跑鞋”,相比多數用 AI 做圖像識別的應用或行業,AI 在醫療落地的難度絕對是最困難的情況。依圖的醫療副總裁鄭永升告訴 DT 君,醫學本身的發展上,不論是所謂科室常規性的應用,還是像腫瘤、基因這樣一些比較前沿的課題,醫學自身的發展和標準化,以及整個臨床規范的普及,其實非常需要深入地進行解決,其中存在的問題也是被人們大大低估的。
姑且先撇除算法必須通過嚴格的臨床實驗及法規,光是在數據及訓練上至少就有兩件事得解決。
首先,真實世界中的數據是海量的,并充滿缺失和不足,實際工作中,很多數據工作都是和真實世界的缺陷做斗爭,這一點在醫學影像中也一樣。數據質量的提升就需要非常非常長的時間周期,和人們討論的醫學倫理相比,這個問題會成為真正的困擾。
盡管大多數放射科已經進行了數百萬次的影像檢查,結構化程度也較高,但是大部分都沒有標記。特別不一樣的是,影像數據很難像語音數據或者文本數據一樣將標注任務外包出去,影像數據的標注大部分只能仰賴專業人士。
舉例來說,不論是在安防領域或是自動駕駛領域,一般人都可以為圖像進行標注,因為常人都可以分辨出人、貓狗動物、汽車、信號燈等,但是,在醫學影像里,一般人根本看不出身體到底哪里出了異常,例如給普通人看一張 CT,他是無法分辨什么有或沒有癌癥、位置在哪里,更不要說有時腫瘤還非常小,這是只有受過專業訓練的醫生才具備的判斷能力。
負責糖尿病視網膜病變計劃的 Google 研究團隊產品經理、醫學博士彭浩怡(Lily Peng)也在接受媒體采訪時曾指出,Google 團隊建立了一個數據集,特意聘請 54 名專業眼科醫師評估超過 13 萬張的圖像。
而在現階段的醫學影像 AI 上,數據幾乎是公認比算法更重要,甚至可以說,醫療數據之于醫學影像 AI 的重要性,已經無異于道路測試之于自動駕駛汽車了?!皵祿从车氖钦鎸嵉氖澜纾惴ú缓线m就換個算法再嘗試”,高亦博教授說。而對于人工智能來說,一條已經被驗證過無數次的箴言是,訓練使用的數據越精確,訓練出來的機器也會變得越強。
因此,想要訓練出好的醫療 AI,就必須仰賴專業醫生的協助,替影像數據進行精確地標注。換句話說,必須有人類名師的幫忙才能培養出 AI 高徒。
除此之外,還有影像數據獲取和使用的問題。醫院內部做 AI 研究,數據獲取是相對容易,但對外部的人來說,想要拿到醫院的影像資料并不簡單。
DT 君和不少業內人士接觸的過程中也發現一個有趣的現象,比起強調歸屬的“采集數據”,他們更多使用的說法是“接觸到數據”。
其中的意味是,政府并沒有明確規定這些數據究竟屬于誰。這一問題也困擾著像醫拍智能這樣的初創公司。成立于 2015 年的醫拍智能主營業務為運用計算機視覺進行醫療單據拍照識別,在今年,他們將業務拓展至醫療影像 AI 上。其首席科學家楊瓊對DT君說:“我們還沒有看到國家有很明確的指導意見,很多醫生都期待更多的改進,但是他們又擔心,這些數據能不能拿出來給公司做訓練呢?國家沒有說可以,也沒有說不可以。”在加入醫拍之前,楊瓊先后任職于微軟亞洲研究院、歐洲微電子中心、百度深度學習研究院。
但是,政府明確許可可以使用這些醫療數據就萬事大吉了嗎?不一定??纯慈蛉斯ぶ悄軜藯U公司 DeepMind 現今的處境吧。
這家造出 Alphago 的 AI 公司, 其實一直在嘗試將人工智能技術應用到醫療中。但他們卻在英國國家衛生局的項目上惹上了麻煩。該項目為 DeepMind 提供了 160 萬個病人的醫療數據,但英國信息專員辦公室確認為 DeepMind 有侵犯病人隱私數據的嫌疑?,F在,DeepMind 仍然陷在數據使用問題引發的官司中。
DT 君還采訪過一家專攻 AI 醫學影像辨識的新加坡初創公司 adaline。這家公司的情況就更為特殊了,他們與新加坡公立醫院合作取得了 1000 多位病患的影像數據,但這個數量是完全不夠的,adaline 希望在包括東南亞、(中國)香港、(中國)臺灣等地區拿到至少 10 萬個病例。
而現實的情況是,想要跟各地的醫院合作就得按各地的法規來走,這對于初創公司來說必定會是一條漫長的路。但沒有人會輕易放棄,因為誰越快接觸到越多數據,就越有可能在這個日益擁擠的市場中占到位置。
“毫無疑問,機器學習將改變放射科醫師在未來幾年的實踐方式,但在機器學習變得普及之前,還有許多工作要做,”斯坦福大學放射學及生理醫療信息系教授 Curtis Langlotz 曾這樣說。
誰來領跑醫學影像 AI?
也正是因為包括上述原因在內的種種因素,在國內,我們還未看到在醫學影像 AI 占據絕對優勢地位的領跑企業。而計算機視覺的第一梯隊已經非常明顯地跑出來了:5年前,施米德胡貝教授的團隊采用深度學習算法贏得了乳腺癌識別檢測的比賽,這是深度學習第一次贏得醫學影像競賽,同樣是在那一年,正在 MIT 實驗室擔任博士后研究員的朱瓏創辦了依圖科技,現在,依圖科技已經位列中國 CV 第一梯隊。
但是,與計算機視覺相比,醫學影像 AI 如今的行業格局,其實更接近于當年互聯網
醫療初期的情況:
在支撐的技術初步成熟和資本加持的前提下,一大批初創的公司正在往外冒,這些公司全部集中來利用深度學習算法讀醫學影像的片子。與此同時,像阿里巴巴、騰訊、科大訊飛這樣的大公司也卯足了勁“插一腳”——阿里健康發布醫療 AI 系統 Doctor You,該系統就包括醫學影像輔助診斷云平臺;騰訊在今年 8 月發起人工智能醫學影像聯合實驗室,并公布其首個 AI 醫學影像產品“騰訊覓影”,輔助早期食道癌等疾病的篩查;科大訊飛有智慧醫療事業部,這家語音人工智能公司在今年 8 月還刷新 LUNA 醫學影像國際權威評測世界記錄……
可當我們回顧熱潮大致退去的互聯網醫療,其結果不可謂不慘烈。在此前一份網上盛傳的“互聯網醫療死亡名單”中,不乏壹藥網等知名互聯網醫療企業。在 2016 年,尋醫問藥網、就醫 160、好大夫等在線醫療平臺傳出裁員傳聞,阿里健康事業部據稱則在 2016 年績效考評中屈居倒數。到了今年年初,百度宣布百度醫生下線,此舉標志著百度退出移動醫療。
從高喊“顛覆”口號到節節受挫再到現在的全面收縮并投靠實體機構,過去這幾年時間里,互聯網醫療可謂經歷了一場名副其實的大起大落。
在這片曾經的熱土上,我們還能看到的尚且站得住腳的也就春雨醫生、好大夫、丁香園、平安好醫生等少數幾家公司。
但醫學影像 AI 浪潮不見得會重蹈這樣的覆轍。
雖然都需要在醫療數據中掘金,但互聯網醫療的模式主要是“平臺化+服務閉環”,其核心主旨可以概括為“連接一切醫療資源”,比起技術優勢,互聯網醫療公司的勝出規則會更強調其資源整合實力,而醫學影像 AI 本身倒更接近于一個工具,生死存亡自然就更依賴于技術。另外,正如上文提到的,醫學影像 AI 對數據的依賴程度比互聯網醫療高得多,伴隨著數據質量提升和規范的漫長過程,其發展周期會更長,懸念也就更大。
其實說起來,醫學影像算是互聯網醫療浪潮中略被忽視的一個方向。互聯網醫療非常注重推行分級診療,但分級診療其實受制于基層硬件設施和醫生能力,因此仍需要一定程度的遠程醫療,而遠程醫療就少不了借助影像報告作為輔助判斷,但在剛剛過去的這輪互聯網醫療浪潮中,醫學影像并不是主攻方向。
盡管如此,醫學影像 AI 仍然受益于互聯網醫療的發展,尤其是在數據上。例如說,2015 年 7 月國務院發布《國務院關于積極推進“互聯網+”行動的指導意見》就明確要求提高醫學影像網絡化、信息化、移動化水平,各種互聯網醫療公司也都曾不遺余力地讓連通各方數據。
互聯網醫療的發展脈絡中,值得那些醫學影像 AI 的初創公司參考的,有一個壞消息和一個好消息。
壞消息是,互聯網本身和醫療其實存在著一些難以調和的天然矛盾,例如說互聯網本身體量很輕,而且十分講究開放,并且追求迭代速度要快,但醫療卻完全相反,體量重而且是個“慢性子”,同時還相對封閉。因此從現在的結果看來,互聯網醫療與其他互聯網+相比并沒有取得更突出的成績,或者說要付出更多的代價才能達到相同的效果,甚至某些方面還落后些。這個經驗很有可能繼續在醫學影像 AI 中得到驗證。
好消息則是,在這一場醫學影像革命中,肯定既會有贏家也會有輸家,和互聯網醫療一樣,不一定是大公司就能笑到最后。醫療領域中巨大的紅利吸引著各大互聯網公司紛紛“鋌而走險”,但對他們來說,醫療仍是一塊最“難啃的骨頭”。
例如,醫學影像 AI 公司的核心競爭力就包括如何基于對數據的理解應用好算法,這其實也考驗他們對應用場景的理解?;ヂ摼W公司在這一點上并沒有太突出的優勢。高亦博教授對 DT 君說:“醫學影像 AI 中,數據最重要。但大部分 IT 企業,包括 BAT 這樣的大公司,往往很難理解數據是怎么生產出來的,所以非常容易出問題”。
而在楊瓊看來,醫療數據中有非常多的“臟活累活”是大公司所不愿意做的,但初創企業會有足夠的熱情和精力投身其中?!拔磥韲鴥纫欢〞幸患冶就凉狙杆俪砷L起來”,她說。但她同樣強調,這其中需要行業標準的充分到位。
依圖的鄭永升同樣坦言他們并沒有感受到來自這些互聯網公司的壓力。“各公司有不同的思路,彼此之間的關系其實更接近于相互補充而非競爭。我認為,巨頭優勢在于資本和品牌優勢。它們很可能沒有認真想做這件事情,但是一旦有動作,那么吸引更多人關注的效果好過創業公司,如果他們認真投入做了,我覺得對整個行業是有推動作用的,這其實是我們樂意看到的”,他說。
但創業公司面臨的也面臨著不少挑戰?,F在,人工智能醫學影像產品主要應用于疾病篩查階段,這個環節能否獲得穩定的商業模式仍然存疑,如果長期依靠融資和微薄的收入支撐業務發展,創業公司也不見得能比財力更為雄厚的互聯網公司跑得更遠。
來自放射科醫生的聲音是,以臨床需求為導向的公司會是最后的勝出者。杜湘珂教授和 DT 君透露,目前醫學影像 AI 仍處于一個非常早期的發展狀態,產品質量參次不齊, 最后能走下去的必然是那些在技術研發上投入大量精力,緊密結合臨床需求,產品過硬的企業。
現在,國內 60% 的醫療影像領域的創業公司處于發展早期(A 輪及之前階段),但同樣已經有幾家醫學影像 AI 公司完成了 B 輪融資,他們比其他同行跑得更快的一批,但下一輪的融資考驗的就不再是用“刷榜”來作為業務的衡量指標。醫學影像 AI 公司迅速邁過科研階段走向商業化落地,醫院和投資機構都在等待他們拿出更成熟的產品和更有說服力的使用數據,2018年的市場考驗將比之前來得更為猛烈。
“與其談算法,不如談標準”?
當數據作為推力把醫學影像推向人工智能的同時,也在一定程度上限制曝露出醫療 AI 正在面臨的艱難問題:中國每年的基礎數據量超過歐美,特別是根據眾多人口數量獲得的醫療和健康數據,這些數據很可能藏著醫療 AI 的下一個風口,但是它們往往缺乏統一的標準(比如說電子病歷,其歷史數據比較多,但數據規范程度比較差),在人工智能所強調的數據的 4V 屬性(volume 數量、variety 多樣性、velocity 速度、veracity 真實性)上缺斤少兩,因此其利用率和利用價值并不高。這些處于留守狀態的醫療數據還需要經過的更為漫長的演進過程才能為人工智能所利用。
當然,醫療數據標準化問題早已引起了業內人士的注意。用依圖醫療總裁倪浩的話來說就是:“僅談算法是外行的表現,內行的人都談標準”。這家中國的 CV 新星在成立早期就以醫學影像為主要切入點,現在,依圖的閱片機器人產品已經在幾十家三甲醫院的影像中心落地。
在改變醫療數據現狀的主力軍中,醫拍智能也是其中的一員,目前他們正在聯合多方進行臨床數據標準的制定工作?!拔覀冊诟恍┽t學機構合作去建立一些醫學標準,進而利用這個醫學標準去處理臨床數據。此前的臨床數據情況是這樣的,不同的醫生用的診斷語言不一樣,各個醫院采用的標準也會有區別。導致這種現象的原因非常復雜,這樣的數據也不能很好地和人工智能技術結合”,楊瓊對 DT 君說。
她也承認,鑒于上述原因,臨床數據的標準化會比影像進展得要慢些,但是,等這個標準建立好之后,其發展速度會非???,因為臨床數據本身非常有價值。
當然,參與這樣的數據標準化制定不會“光吃力不討好”,其所帶來的好處是顯而易見的:在算力和算法持續快速進步的基礎上,獲取相當數量的高質量數據已經成為醫療 AI 最重要的競爭力;作為醫療領域最重要的資源之一,數據的歸屬和使用很有可能在標準化過程中面臨發生新的變化,越早越廣泛地參與到規則的制定,即意味著公司能夠掌握更多的主動權。
在此類討論中,永遠有一點值得所有人記?。阂粓鲠t療革命注定會造就市場上的所謂贏家和輸家,但最大受益者將是所有獲得更好治療的患者以及躲過了疾病魔爪的人們。
醫學影像對于大多數人來說都不陌生,幾乎也和每一個人都相關。這項可以讓醫生無需動刀就能觀測病患身體內部狀況的技術,包括我們聽說過的超音波、 X 光片,還有電腦斷層掃描(CT)、核磁共振成像(MRI)、正子造影(PET)、單光子斷層掃描(SPECT)等。每一種方式都有自身優勢,適合用來檢查不同的病癥。
在醫院中,負責解讀醫學影像的是“放射科醫生”。他們的工作就是查看影相資料、打出報告,提供給??漆t生去擬定治療方案。
這個看似尋常的操作背后隱藏著一個巨大的行業缺口:我國醫學影像數據的年增長率約為 30%,而放射科醫師數量的年增長率約為 4.1%,醫師數量的增長遠不及影像數量的增長,且培養具有專家診斷水平的醫生耗時漫長。其帶來的隱患是顯而易見的,比如說繁重的任務帶來較高的誤診、漏診率。
放射科醫生的工作負擔之重遠超人們
的想象。由于影像檢查的對臨床診斷的重要意義,大部分患者來醫院就診均會接受影像檢查,檢查后會產生大量的圖像數據,根據檢查方法的不同,有些患者的檢查圖像可多達近千幅。這些數據經網絡傳輸到醫師工作站后,放射科醫生需要在顯示器上一張一張地觀察圖像,手動圈出腫瘤的位置,簡單病例的幾分鐘能搞定,復雜的要花半個小時以上。大醫院的放射科醫師每天都要閱讀上百位患者圖像。
因此,醫學影像 AI 對醫療界的吸引力之一就在于它能幫助醫生提高診斷效率。事實上,醫學影像的環節處于整個醫療過程中非常上游的環節,他們眼前的黑白影像世界直接決定著臨床決策,其“牽一發而動全身”的效果非常明顯,能在這個環節幫助到醫生意味著巨大的機會。一旦 AI 協助醫生提高了看片的速度,那么現今醫護供給、需求高度落差的狀況就能得以改善,也會有更多的病患能從中受惠,不論是能夠更快速地找到治療方法還是預防其他病癥的產生,都意義重大。
醫學影像 AI 同樣受到了來自政府的高度關注。 12 月 14 日,工信部印發的《促進新一代人工智能產業發展三年行動計劃(2018-2020 年)》通知中,醫學影像 AI 就被點名,位列 8 類重點發展的人工智能產品之中(其它7類包括智能網聯汽車、智能服務機器人、智能無人機、視頻圖像身份識別系統、智能語音交互系統、智能翻譯系統、智能家居產品)。
更早之前,在 11 月 15 日,科技部則是公布了一份“首批國家人工智能開放創新平臺名單”,分別包括自動駕駛、城市大腦、醫療影像、智能語音這四大平臺。
從這些動作中我們也發現,醫學影像 AI 正迎來種種擁躉,成為醫療 AI 中的“爆款”,但這樣熱鬧的景象,難免會讓人忘了醫療其實是一個往往需要“坐足十年冷板凳”的行業,在這一點上,“爆款”也將難以例外。