原創(chuàng) 2018-02-23 BioTalker 奇點網
今天,由張康教授領導的廣州婦女兒童醫(yī)療中心和加州大學圣迭戈分校團隊,在頂級期刊《細胞》上發(fā)表了一篇人工智能(AI)在醫(yī)療領域應用的重磅研究成果:基于深度學習開發(fā)出一個能診斷眼病和肺炎兩大類疾病的AI系統(tǒng)[1],準確性匹敵頂尖醫(yī)生。
這不僅是中國研究團隊首次在頂級生物醫(yī)學雜志發(fā)表有關醫(yī)學人工智能的研究成果;也是世界范圍內首次使用如此龐大的標注好的高質量數(shù)據進行遷移學習,并取得高度精確的診斷結果,達到匹敵甚至超越人類醫(yī)生的準確性;還是全世界首次實現(xiàn)用AI精確推薦治療手段。
《細胞》以封面文章的形式,刊登了來自中國的這項AI研究。
期刊封面
深度學習是AI的熱門研究領域,2006年由多倫多大學教授Geoffrey Hinton[2]提出,我們所熟知的AlphaGo、AlphaGo Zero,以及自動駕駛這些重量級應用,都是基于深度學習技術開發(fā)的。
不過,最讓我們期待的,可能是AI在醫(yī)療領域的應用。
在全世界范圍內,專業(yè)高質量的的醫(yī)療資源是稀缺的。有許多缺乏??漆t(yī)生的相對貧困的地方,許多人對自己的疾病狀況不自知,即使在相對發(fā)達的城市區(qū)域,由于城市人口多、人口老齡化、慢性病發(fā)病率增高等導致病人數(shù)量龐大,而對應的專科醫(yī)生供不應求,也使得大量病人不能及時轉診就醫(yī),從而延誤就診治療的最佳時機。
因此,科學家十分期待AI可以對診前疾病的篩查、預防,就診時醫(yī)療圖像輔助診斷、檢驗結果分析、手術輔助,以及就診后的醫(yī)療隨訪、慢性病監(jiān)測、康復協(xié)助、健康管理,甚至對于基礎科研輔助、藥物研發(fā)、基因篩選分析、醫(yī)療培訓等等帶來革命性的變革。
研究論文首頁
不過這一切來得似乎沒有那么容易。
直到10年后的2016年,深度學習終于在大數(shù)據、圖形處理器運算能力增強和新算法的支撐下,迎來高速發(fā)展。
也就是這一年,Google的Gulshan團隊采用近13萬張已由54位美國專家標注過的視網膜眼底圖像,對深度學習網絡進行訓練,檢測準確率達到曲線下面積91%,能力與人類專家相當[3]。這項研究成果最后發(fā)表在頂級醫(yī)學期刊JAMA上。
沒多久,在2017年春節(jié)期間,斯坦福大學工程學院和醫(yī)學院合作團隊在《自然》上發(fā)布了在皮膚癌診斷領域的最新突破[4]。他們在谷歌用于識別貓和狗算法的基礎上,經過13萬張皮膚病變的圖像訓練后,開發(fā)出可用于識別皮膚癌的AI系統(tǒng)。在與皮膚科醫(yī)生的較量中,AI系統(tǒng)的準確率達到69.4%,而人類專家的準確率在66%左右。
在本研究中,張教授團隊應用一個多層次的前饋DNN概念,將預訓練模型Inception-v3架構植入到開源機器學習平臺TensorFlow,輸入總共約10萬張準確標注的視網膜OCT(Optical Coherence Tomography, 光學相干斷層成像術)圖像,最后開發(fā)出可以準確診斷眼疾的AI系統(tǒng)[1]。
該AI系統(tǒng)在診斷眼疾時的準確性達到96.6%,靈敏性達到97.8%,特異性達到97.4%,ROC曲線下面積達到99.9%。
AI系統(tǒng)與6個專家大比拼數(shù)據對比
盡管AI在醫(yī)學領域的探索已經取得了相當不錯的成績,但是最終應用到臨床卻很少。北京協(xié)和醫(yī)院放射科主任金征宇教授認為,主要原因之一是人工智能系統(tǒng)在復雜的臨床應用中,不能準確收集到高質量可應用的數(shù)據(即有效數(shù)據),所得出的結論缺乏可靠性,難以保持測試數(shù)據集上的高準確率[5]。
2016年Google那篇文章在JAMA上發(fā)表的時候,論文的主要作者Gulshan如是說:“訪問有高質量注釋圖的大型數(shù)據庫,是深度學習模型成功的先決條件。”
正如前面Google和斯坦福大學,以及張康教授團隊的研究所呈現(xiàn)的那樣,訓練出一個準確的AI疾病診斷系統(tǒng)需要數(shù)十萬張高質量標注的圖像。
可世界上有那么多種疾病,給每種疾病都收集數(shù)十萬張高質量的標注圖像幾乎是不可能實現(xiàn)的。這個問題不解決,現(xiàn)階段AI在醫(yī)療領域的應用就很難全面展開。
張康教授團隊這個重磅研究,就很好的解決了這個問題。
“相比于傳統(tǒng)的深度學習模型,我們使用的遷移學習模型所需的數(shù)據量極少,一般深度學習需要上百萬的高質量的同一類型標注圖片才能獲得較為穩(wěn)定和精確的輸出結果,而我們的方法只需要幾千張。”張康教授告訴奇點網,“并且我們構建的診斷平臺在診斷常見的致盲性視網膜疾病上,能夠獲得與人類眼科專家相似甚至更好的診斷結果。”
張康教授
“遷移學習”(Transfer Learning),顧名思義就是就是把已訓練好的模型參數(shù)遷移到新的模型來幫助新模型訓練,也就是運用已有的知識來學習新的知識,找到已有知識和新知識之間的相似性,用成語來說就是“舉一反三”。
比如,已經學會下圍棋,就可以類比著來學習象棋;會打籃球,就可以類比著來學習排球;已經會中文,就可以類比著來學習英語、日語等等。如何合理的尋找不同模型之間的共性,進而利用這個橋梁來幫助學習新知識,就是“遷移學習”的核心。遷移學習被認為是一種高效的技術,尤其是面臨相對有限的訓練數(shù)據時。
相較于其他大多數(shù)學習模型的“從零開始”,遷移學習先利用卷積神經網絡(Convolutional Neural Network,CNN)學習已有的已經標記好的預訓練網絡系統(tǒng)。
以醫(yī)學圖像學習為例,該系統(tǒng)會識別預系統(tǒng)中圖像的特點,研究人員再繼續(xù)導入含有第一層圖像相似參數(shù)和結構的網絡系統(tǒng),最終構建出終極層級。
在張教授團隊開發(fā)的AI系統(tǒng)中,第一層網絡就是視網膜OCT圖像,第二級網絡系統(tǒng)使用第一級的圖像尋找相應的特點,通過前向傳播固定低層圖像中的權重,找到已經學習的可辨別的結構,再利用反向傳播的方法提取更高層的權重,在其中進行反復的自我調整和反饋、傳遞,達到學習區(qū)分特定類型的圖像的目的。這個模型可以使用極少的訓練圖像,更快、更高效的辨認圖像的特定結構。
(圖:https://morvanzhou.github.io/)
為了驗證這個AI系統(tǒng)在遷移學習的幫助下能應用于視網膜疾病之外的其他疾病,在本研究中,張教授團隊在10萬張準確標注的視網膜OCT圖像訓練出來診斷眼疾的AI系統(tǒng)基礎上,只用了5000張胸部X線圖像,然后利用遷移學習,就構建出肺炎的AI疾病圖像診斷系統(tǒng)。
這套AI系統(tǒng)在區(qū)分肺炎和健康狀態(tài)時,準確性達到92.8%,靈敏性達到93.2%,特異性達到90.1%,ROC曲線下面積達到96.8%;更牛的是,它區(qū)分細菌性肺炎和病毒性肺炎的數(shù)據也是相當漂亮,準確性達到90.7%,靈敏性達到88.6%,特異性達到90.9%,ROC曲線下面積達到94%。
在世界范圍內,使用如此龐大的標注好的高質量數(shù)據進行遷移學習并取得高度精確的診斷結果,得到與人類醫(yī)生相似甚至更高的準確性,這在世界上是第一次。
張教授團隊在實現(xiàn)一個AI系統(tǒng)診斷多種疾病上,可沒少花心思。
通過預先的訓練,他們的AI系統(tǒng)已經可以達到準確判斷視網膜疾病的效果,加上一定數(shù)量標注好的正常及肺炎X線平片對其進行訓練,再通過簡單的調整,包括層的重排和層中為適應輸出肺炎圖像而增加“過濾器(filters)”的數(shù)量,機器通過前饋機制自我訓練、自我學習,找出兩者之間的異同點對照學習,舉一反三,直接獲得穩(wěn)定的較高的肺炎診斷準確率。
“一個AI系統(tǒng)診斷多種疾病的關鍵因素是,對于診斷不同的疾病之間的切換的容易度。”張康教授說,“在其他的研究中,研究者需要根據不同的疾病設計相應的過濾器,而我們的算法會根據輸入的學習圖像產生自己的過濾器。”
張康教授認為,遷移學習在深度學習上面有極為廣闊的應用前景,在圖像數(shù)據資源有限的醫(yī)療領域,更高效、所需圖像數(shù)量更少的遷移學習,可以說是未來5年內AI發(fā)展的熱點以及深度學習成功應用的驅動力。
實際上,遷移學習是深度學習的一個自然發(fā)展方向,它能讓深度學習變得更加可靠,還能幫研究人員理解深度學習的模型。
例如,研究人員能夠知曉哪部分特征容易遷移,這些特征所對應的是某個領域比較高層、抽象的一些結構型概念。把它們的細節(jié)區(qū)分開,就能讓研究人員對這個領域的知識表達形成一個更深的理解。這樣一來,機器就可以像人腦的神經系統(tǒng)一樣終身學習,不斷地對過去的知識進行總結、歸納,讓一個系統(tǒng)越學越快,而且在學習過程中還能發(fā)現(xiàn)如何學習。
遷移學習在機器學習中的地位以及未來的發(fā)展趨勢
本研究另一個亮點在于,之前的AI系統(tǒng)對于疾病的診斷具有參考意義,但不能指導治療,而視網膜OCT在糖尿病視網膜病變和黃斑變形的診斷上可以量化并能夠指導治療,因此具有不可替代的價值。
例如,張教授團隊開發(fā)的AI系統(tǒng)可以準確判斷患者是哪種眼疾,哪些需要“緊急轉診”,哪些“常規(guī)轉診”即可。這可以幫助醫(yī)生快速判斷哪些患者屬于重癥患者,需要及時治療,以避免疾病對患者造成不可逆的傷害。
張康教授團隊的這項研究意義遠不止如此。他們還考慮到了一個最讓醫(yī)生關注的問題。
在使用AI診斷疾病的時候,醫(yī)生最不放心的就是:AI到底是如何判斷的?到底靠不靠譜啊?
對于這個問題,張教授團隊也巧妙地解決了。他們在視網膜OCT圖像的研究中加入了“遮擋測試”,也就是機器會輸出色塊遮擋其“認為”的病變部位,這樣醫(yī)生就可以直觀評價機器診斷的正確性,也為其形成診斷提供依據。
AI系統(tǒng)用色塊遮擋住病變區(qū)域
這下醫(yī)生就可以放心了,如果對于AI的診斷不放心,可以通過遮擋測試直接查看AI是如何作出疾病“判斷”的。
張康教授說,目前他們的AI系統(tǒng)已經在美國和拉丁美洲眼科診所進行小規(guī)模臨床試用,取得經驗后在進行大規(guī)模推廣。此外,在后續(xù)的研究中,他們還會進一步增加準確標注的圖片數(shù)量,同時增加可診斷的疾病種類,并進一步優(yōu)化系統(tǒng)等。
他們希望在不久的將來,這項技術將能應用到包括初級保健、社區(qū)醫(yī)療、家庭醫(yī)生、??漆t(yī)院等等,形成大范圍的自動化分診系統(tǒng),為醫(yī)生提供一種輔助診斷的方法,并可用于監(jiān)測和維護人類健康,從而提高人類生活質量。
編輯神叨叨
張教授之前接受過我們的獨家專訪,想了解張教授的朋友,可以點擊此處去看看。
參考資料:
1. Kermany et al. Identifying Medical Diagnoses and Treatable Diseases by Image-Based Deep Learning[J]. Cell, 2018, 172: 1-10.
2. Hinton G E, Salakhutdinov R. Reducing the dimensionality of data with neural networks.[J]. Science, 2006, 313(5786): 504-507.
3. Gulshan V, Peng L, Coram M, et al. Development and validation of a deep learning algorithm for detection of diabetic retinopathy in retinal fundus photographs[J]. Jama, 2016, 316(22): 2402-2410.
4. Esteva A, Kuprel B, Novoa R A, et al. Dermatologist-level classification of skin cancer with deep neural networks[J]. Nature, 2017, 542(7639): 115.
5. 金征宇. 前景與挑戰(zhàn): 當醫(yī)學影像遇見人工智能[J]. Med J PUMCH, 2018, 9(1):2-4