邢磊:深度學習應用非常廣泛。在大數據方面中做研發的人很多。谷歌所提供的開源算法平臺大大地降低了進入人工智能的門檻,很多人朝著這個研究方向里面涌,可能今后幾年大家會看到各類應用像雪崩一樣襲來。
與此同時,面臨的困難當然有很多。首先,計算量很大,目前的計算能力如果處理二維圖像的話沒什么大問題,但要進行三維,甚至四維的圖像處理(時間加上空間),那么現代計算機的計算和存儲能力都成為了一個阻礙。
所以,未來會需要一些針對具體應用的算法創新,來縮短計算時間,提高計算效率。
這些困難需要怎樣的突破的方向?
邢磊: 大家不能只專注于研發通用型的算法,針對細節及具體應用的研究將有助于人工智能落地并造福于人類。
智能醫療決策尚處于原始階段
醫學影像與病例病史等資料的整合,從而做出綜合的智能分析決策,現在處于怎么樣的水平階段了?
邢磊:非常原始的階段。現在醫院對病人進行系統的綜合的智能分析決策做得還非常不夠,比如今天一名病人的核磁結果來了,就分析一下,但實際上,這名病人也許在十年前也留下了相關的核磁、CT及病例病史等結果,這些歷史數據是否能夠整合呢?如有了全面的智能分析決策之后,效果會好的多。
當然,這方面開始“想”的人很多,只是開始做的人很少。因為實施起來有很大的難度,首先必須先有技術,醫生不可能自己寫程序,而且得有大量的臨床數據證明這樣的做法的有效性,大家才會接受。
對人工智能在醫療領域,以醫學影像領域來說,你的前景展望,未來愿景是怎樣的?
邢磊:我個人覺得是,將來每一個放射科的醫生,手機上或者電腦終端都會有一個智能分析決策的APP,也就是說,基本上所有的要經過放射科(當然也包括其它科室)的病人,同時也會經過這個APP,尤其是疑難病癥,由人工智能來輔助分析決策。今天會上大家已經看到,匯醫慧影已經在打造這樣一個智能醫療影像平臺方面取得了驚人的進展。
那么,最終計算機是否會取代放射科醫生呢?
近期來看是可能性不大的,因為這過程中還需要人來進行質量控制和最終決策。但是,技術確實會帶來巨大的幫助,除了提高效率之外,它可以提出提高質量和精度, 促使很多醫生去想很多以前想不到的問題。俗話說,三個臭皮匠頂個諸葛亮。 人工智能是由三個諸葛亮打造而成的,應該是一位超級醫生。)
中國AI醫療發展不遜色于國外
中國進行AI醫療研究的條件和國際相比如何?
邢磊:總體來說,差別不大。硬件方面,國內超算首屈一指,但講到高性能計算機,國內可能沒有國外那么普及。從研究方面來講, 可以很明顯地看到國內這個智能領域的熱度在上升 。
我曾經提到過,數據不集中不規范是目前智能醫學發展的最大障礙之一,國內在這一方面還有很多優勢的 ,畢竟政府可以很高效地進行協調、協商,鼓勵來解決這個問題,可能要比國外更高效。
當前以人類水平作為機器學習的標準尚是合理
一般來說衡量AI醫學影像的水平,會拿它與人類的識別能力作比較以作為標準,您覺得這是否合理?
邢磊:合理也不合理。合理的方面是,在研發的初期,行業沒有更好的標準,不單單是人工智能技術,以往影像科學的發展,都經常用專家的水平來作為判斷的標準,比如說醫學圖像的分割,計算機輔助的乳腺癌診斷, 等等。
那么,將來是否能夠以機器學習出來的并驗證后的(超級醫生的)結果作為標準呢?
邢磊:這是一個值得探索的問題,但最終我認為還是最終要由臨床醫生的參與。
總的來說,一個新的方法在拿出來應用時,總得要有一個benchmark, 之后所做的創新改進,也都要尋找新的benchmark。
主攻自動化醫療決策研究
您現在主要進行的研究是哪方面?您最感興趣的課題是什么?
邢磊:我的實驗室研究范圍很廣,從基礎的影像設備,分子影像,圖像重建和處理,影像和基因組學,治療計劃,到臨床數據采集分析。這些研究中很多項目都涉及到機器學習和人工智能的應用。 可以說未來人工智能將是醫學研究和臨床應用中必備的組成成份。 我們最近在機器學習和人工智能應用方面所做的研究包括, 用深度學習來做圖像分割和處理 , 用機器學習來把臨床上要用技術員和醫生來做的工作自動化,用人工智能來讓來幫醫生做臨床決策,以及用人工智能來實現對一些有局限情形下采集的數據進行處理和圖像重建。
舉個簡單的例子,在實施放療的過程中,醫生需要制定治療計劃,治療計劃是一個技術機優化的過程,這個過程中涉及很多決策,用人工智能來做這項工作會非常地有效,原來數小時甚至數天才能做完的工作,計算機十幾分鐘就能完成,而且質量能夠有保證。所以說,人工智能在提高效率和質量都會有巨大的幫助。
那可不可以請邢教授講一講,大數據人工智能里面有哪些學術流派,包括算法,是我們不知道的,而你看到的,或者正在研究的?
邢磊:實際上大數據還有人工智能也不是一個新的概念。人工智能在50年代就已經提出來,當時以斯坦福大學計算機系的John McCarthy 為代表的科學家已清楚地認識到了“人工智能”的重要性。 也許是由于很多歷史的原因, 人工智能有三個比較大的所謂學派:
第一個是符號主義。早期AI運算多使用用符號操作系統。符號主義主要是從心理學的角度來看人工智能問題,它相信人的認知可以通過符號表達出來,從而進行AI計算。現在這個方法仍然很活躍, 最近深度學習的成功給符號主義注入了新的活力 。
第二是進化主義, 這個AI理論主要基于控制論和感知-動作型系統。進化論主義也在用計算機模擬人的認知過程中起了不可磨滅的作用。
第三是仿生學派。最近被媒體炒得最熱的神經網絡 (neuro-network)就是這個學派。基于大腦是由神經元和連接神經元的網絡這樣一個基本模型,通過學習來訓練 neuro-network 似乎是非常直觀的方法。但從80年代到90年代, 神經網絡的研究起色并不十分顯著,主要是計算機的計算速度和存儲跟不上。因為計算量太大,不用說深度學習,就是一般的單層網絡也較難處理。
人工智能的學習有三個主要的部分:數據、模型、算法。
數據方面,除了需要大量的高質量數據以外,數據的標準化也至關重要。在斯坦福大學的生物醫學信息專業,其中一個很大的實驗室就是致力于怎樣把術語標準化。把所有的醫學,工業和商業術語用標準語言表達出來實際上是一項很浩大的工程。
模型方面,最值得一天的恐怕要是深度增強學習(Deep Reinforcement Learning),reinforcement learning已存在已久,是從一些運籌學(operation,最值得一天的恐怕要是深度增強學習(Deep Reinforcement Learning),reinforcement learning已存在已久,是從一些運籌學(operation research)的方法衍生發展而來。深度增強學習特別適合于解決一些人工智能里有關機器和環境相互作用的問題。
算法方面, 進展可以說是更加迅猛,新的算法層出不窮。
總的來講,學習的算法和要解決的具體問題有很大的關系。算法本身的優化無論對計算效率和精度都有很大的影響。很多細節可以在算法中體現出來。比如如何處理學習和觀測過程中的各種不確定性,如何把解決高維所帶來的大計算量問題,如何將各種先驗知識量化并包括在學習的過程中,等等。基于機器學習的醫學影像技術及算法, 比如核磁共振和CT的圖像重建,已經開始考慮上面所提到的諸多因素。 在這兒我舉個例子。大家知道病人做CT時是要接受放射性的。做一個CT,一般要接受 1-3 cGy 的劑量。 低劑量的CT能不能行?幾年前,大家試圖用所謂的壓縮感知技術來實現低劑量CT。用機器學習可以把這個問題解決的更徹底完善,因為以前的經驗數據都可以很容易地包括在重建的過程中。這樣一來我們就不用采集那么多X光投影數據啦,實現減少劑量而不影響成像質量。機器學習和人工智能在醫學中的應用前景是十分廣泛的 。在今后的幾年里我們將會看到很多革命性的突破。