阿里達摩院 AI醫(yī)療 「鑄劍」四年:上線170家醫(yī)院,落地57座城市
編者按:本文來自微信公眾號“機器之能”(ID:almosthuman2017),作者凡雪,36氪經(jīng)授權(quán)發(fā)布。
疫情突然,對于各行各業(yè)來說都是一場大考,尤其是 AI 醫(yī)療行業(yè),從疫情咨詢、藥物研發(fā)、病毒基因分析再到臨床診斷等多個環(huán)節(jié),緊急上陣,達摩院醫(yī)療 AI 團隊卻連點成線,應(yīng)用「處處開花」。
在這背后,是達摩院醫(yī)療 AI 團隊的四年蟄伏,從肺部 CT 影像切入醫(yī)療 AI,到后來在肝結(jié)節(jié)、心血管、骨科等方面均取得不錯進展。
疫情當(dāng)下,不僅僅是達摩院醫(yī)療 AI「仗劍」逆行,國內(nèi)無論是互聯(lián)網(wǎng)企業(yè)、醫(yī)療相關(guān)企業(yè)都在馳援路上,讓醫(yī)療 AI 價值在抗疫中得到驗證,從而加快相關(guān)產(chǎn)品落地,一定程度上解決以往醫(yī)療 AI 企業(yè)營收困難的現(xiàn)狀。
正如達摩院高級研究員華先勝所說 AI 助攻,人類醫(yī)生提效,完成這一愿景指日可待。
撰文 | 凡雪
編輯 |四月
現(xiàn)如今,疫情正逐漸蔓延至全球,國內(nèi)疫情肆虐的風(fēng)暴過后,每當(dāng)復(fù)盤抗疫歷程,阿里、達摩院,總會成為不可忽視的關(guān)鍵詞條。
的確,不論是與浙江疾控中心合作的基因檢測平臺,將疑似病例基因分析時間縮至半小時;還是率先在鄭州「小湯山」應(yīng)用的 CT 影像系統(tǒng);或是國內(nèi) 57 座城市都在用的智能疫情機器人,阿里抗疫覆蓋疫情咨詢、藥物研發(fā)、病毒基因分析、臨床診斷等多個環(huán)節(jié),力度不可謂不大。
如今影響力還在不斷擴散,據(jù)阿里統(tǒng)計,截至 3 月 31 日,達摩院 CT 影像 AI 已在浙江、河南、湖北、上海、廣東、江蘇、安徽等 16 個省市近 170 家醫(yī)院落地,已診斷 34 萬臨床病例。
隨著疫情全球擴散,3 月 31 日,達摩院 AI 隨著阿里云一同出?!毡局t(yī)療科技機構(gòu) JBC 正式上線阿里云新冠肺炎 AI 診斷技術(shù),開始向日本醫(yī)院提供這一服務(wù),幫助醫(yī)生通過 CT 影像快速進行新冠肺炎篩查。
一達摩院「仗劍」逆行「系統(tǒng) 20 秒內(nèi)對新冠疑似患者 CT 影像做出判讀,并量化病癥的輕重程度,分析結(jié)果準確率達到 96%」,從華先勝嘴里跳出的數(shù)據(jù),直觀地顯示著這套系統(tǒng)的輔助作用。
華先勝是阿里巴巴集團副總裁、達摩院高級研究員,2001 年北大數(shù)學(xué)系博士畢業(yè),在微軟工作 14 年后被「阿里云之父」王堅挖角,開啟阿里在 AI 視覺研發(fā)和落地方面的探索。
2 月 4 日,達摩院接到任務(wù),要借助 AI 技術(shù)對新冠疑似案例 CT 影像做出判讀,4 天內(nèi),達摩院算法團隊便已構(gòu)建出一個識別模型,模型剛出來,團隊便在小范圍數(shù)據(jù)集上做測試。
但僅僅基于小范圍的數(shù)據(jù)產(chǎn)出的產(chǎn)品并不足以讓人信服,加之彼時疫情尚處初期,全球尚無充足的臨床數(shù)據(jù),更無標(biāo)準的數(shù)據(jù)集。
在這種情況下,團隊轉(zhuǎn)換思路,調(diào)取出原有存量數(shù)據(jù)——天池大賽中「肺部 CT 多病征智能診斷」數(shù)據(jù),另一方面,達摩院還加緊與外部機構(gòu)協(xié)作,與浙大一院、萬里云、長遠佳和古珀醫(yī)院等多家機構(gòu)合作,很快就突破了訓(xùn)練數(shù)據(jù)不足的局限。
據(jù)了解,天池大數(shù)據(jù)競賽是由阿里巴巴主辦,面向全球科研工作者的高端算法競賽。通過開放海量數(shù)據(jù)和分布式計算資源,讓參與者有機會運用其設(shè)計的算法解決社會或業(yè)務(wù)問題。
最終,達摩院基于 5000 多個病例的 CT 影像樣本數(shù)據(jù),學(xué)習(xí)、訓(xùn)練了樣本的病灶紋理,通過 NLP 自然語言處理回顧性數(shù)據(jù)、使用 CNN 卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練 CT 影像的識別網(wǎng)絡(luò)。
2 月 15 日,這套系統(tǒng)第一個趕赴的地方便是鄭州岐伯山醫(yī)院,作為鄭州「小湯山」,它是一家新冠肺炎確診患者定點救治醫(yī)院,一位病人的 CT 影像大概有 300 張左右,而醫(yī)生對一個病例的 CT 影像肉眼分析耗時大約為 5-15 分鐘,這給醫(yī)生臨床診斷帶來巨大壓力。
達摩院 CT 影像 AI 系統(tǒng)能直接算出病灶部位的占比比例,量化、預(yù)測病癥的輕重程度,大幅度提升診斷效率,為患者的治療爭取寶貴時間。
AI 自動識別新冠肺炎病例 CT 胸片
值得一提的是,在 CT 影像識別算法之外,達摩院還與阿里云研發(fā)了輔助診斷算法,該算法可以根據(jù)患者基本信息、癥狀、實驗室檢查結(jié)果、流行病學(xué)史、影像報告等多維信息,進一步幫助輔助醫(yī)生制定科學(xué)的治療方案。
截至 3 月 31 日,這套 AI 系統(tǒng)已在浙江、河南、湖北、上海、廣東、江蘇、安徽等 16 個省市的 170 家醫(yī)院落地,診斷超過 34 萬臨床病例。
除了 CT 影像 AI 系統(tǒng),疫情期間,達摩院做的事情還有很多,覆蓋疫情咨詢、藥物研發(fā)、病毒基因分析、臨床診斷等多個環(huán)節(jié)。
1 月 27 日,達摩院連夜研發(fā)的智能疫情機器人。上線后便在全國各地投入使用,很快落地全國 27 個省、直轄市、自治區(qū),免費為 57 座城市撥打 1600 萬通防控摸排電話,摸排超過 20 萬身體異常人群。
2 月 1 日,達摩院醫(yī)療 AI 算法,正式應(yīng)用于新冠肺炎的病原學(xué)檢測。達摩院與浙江省疾控中心合作,利用算法將疑似病例基因分析時間縮至半小時,該技術(shù)可以避免核酸檢測出現(xiàn)的漏檢情況,同時可以及時檢測到變異病毒。
「我們的基因分析覆蓋了 95% 以上的全序列,準確率近乎 100%,從自動化建庫到基因測序再到最后一步基因分析(達摩院只提供最后一步服務(wù)),整個流程只需 14 小時,其他全基因組測序方法則一般需要兩三天」,華先勝說道。
達摩院算法專家設(shè)置基因檢測分析參數(shù)
此外,疫情期間,達摩院醫(yī)療 AI 團隊還提供了醫(yī)療專業(yè)翻譯系統(tǒng)、疫情預(yù)測等系統(tǒng),為更大范圍、更高層次的抗疫,提供信息支撐。
二「鑄劍」四年
2016 年,達摩院醫(yī)療 AI 由時任阿里巴巴 iDST 副院長的華先勝帶隊打造。
彼時人工智能熱潮剛剛掀起,行業(yè)內(nèi)對人工智能的探討還僅僅局限在技術(shù)研發(fā)上,在落地場景上基本沒有考量,具體到醫(yī)療領(lǐng)域可以在哪些場景驅(qū)動技術(shù)的落地,更是一片未知。
但當(dāng)時的華先勝堅信:人工智能進入醫(yī)療健康領(lǐng)域,是一個必然的事情,作為視覺智能領(lǐng)域深耕多年的專家,華先勝團隊從肺部 CT 影像開始切入醫(yī)療 AI,很快就做出成績。
2017 年 7 月,達摩院 AI 在國際權(quán)威的肺結(jié)節(jié)檢測大賽 LUNA16 上打破世界紀錄,憑借 89.7% 的平均召回率(在樣本數(shù)據(jù)中成功發(fā)現(xiàn)結(jié)節(jié)占比的比例)奪冠。
大賽要求選手對 888 份肺部 CT 樣本進行分析,尋找其中的肺結(jié)節(jié)。樣本共包含 1186 個肺結(jié)節(jié),75% 以上為小于 10mm 的小結(jié)節(jié)。最終,達摩院在 7 個不同誤報率下發(fā)現(xiàn)的肺結(jié)節(jié)平均召回率達到 89.7%,超出第二名 0.2%。
不同誤報次數(shù)下召回率情況
這一次「第一」儼然有著承上啟下的「里程碑」意義,為阿里達摩院新冠肺炎的 CT 自動診斷系統(tǒng)打下了基礎(chǔ),同時開啟了達摩院更加廣泛的研究范圍。
2018 年 12 月,達摩院 AI 從近百支隊伍中脫穎而出,在全球 LiTS(Liver Tumor Segmentation Challenge,肝臟腫瘤病灶區(qū) CT 圖像分割挑戰(zhàn)) 獲得兩項第一;
2019 年的心臟冠脈中心線提取鹿特丹比賽(Rotterdam)上,達摩院 AI 獲得全自動提取賽事第一名,相關(guān)論文被國際頂級醫(yī)學(xué)影像會議 MICCAI 2019 提前接收;
2019 年, 達摩院 AI 獲得 EMNLP 2019 微生物群落信息抽取比賽 (BB Task)「關(guān)系和實體聯(lián)合抽取」任務(wù)冠軍。
正是由于達摩院此前四年基礎(chǔ)研究的「厚積」,才帶來了疫情期間的從點到線到面的技術(shù)應(yīng)用,讓阿里看到了底層創(chuàng)新與產(chǎn)業(yè)土壤深度結(jié)合,不斷蝶變的可能。
而阿里健康的升級,便將發(fā)生在這些技術(shù)加持帶來的業(yè)務(wù)應(yīng)用全面爆發(fā)的背景下。
三助攻醫(yī)生提效 疫情發(fā)生的突然,無疑給各行各業(yè)進行一次「大考」,尤其是 AI 醫(yī)療行業(yè),然而,如果將問題換個角度,這其實也是一場機遇,在阿里健康資深副總裁馬立看來,疫情對消費者、醫(yī)院對于互聯(lián)網(wǎng)醫(yī)療、影像 AI 系統(tǒng)等認知大大增強。
原先,醫(yī)療 AI 產(chǎn)品在實際落地醫(yī)院過程中并不順暢,「醫(yī)療 AI 行業(yè)大家收入都很少,以前按研發(fā)比如說科研合作掙取收入,現(xiàn)在也可以通過招標(biāo)將產(chǎn)品落地醫(yī)院」,匯醫(yī)慧影一位員工此前向機器之心透露道。
招標(biāo)是醫(yī)療 AI 企業(yè)產(chǎn)品進入院方的一種方式,院方發(fā)布需求,同類別企業(yè)進行競標(biāo),但是過程并不順暢,無論是產(chǎn)品或是科研成果迅速落地比較難,因此渠道資源,醫(yī)院人脈就顯得十分重要,他們在一定程度上可以幫助產(chǎn)品「打入」醫(yī)院內(nèi)部。
然而,即使進入醫(yī)院內(nèi)部,能被多大程度接受,應(yīng)用程度如何也是未知,據(jù)新京報「尋找中國創(chuàng)客」報道,在 AI 產(chǎn)品扎堆的影像領(lǐng)域,一個三甲醫(yī)院可能同時安裝 10 余家 AI 公司的產(chǎn)品,醫(yī)生真正使用的只有一兩家,因為 AI 找到結(jié)節(jié)后尚不能輔助診斷,且目前產(chǎn)品多集中在肺結(jié)節(jié)查找上,同質(zhì)化嚴重,而這些需要深度學(xué)習(xí)的 AI 產(chǎn)品,少了醫(yī)生的糾錯與補充,模型迭代也會變慢。
這一點馬立有很大感觸,「之前跟很多資深醫(yī)生交流,有一些醫(yī)生對于信息技術(shù)比較開放,但有些醫(yī)生對于 AI 便持懷疑態(tài)度」,「但疫情過后,根據(jù)我們接觸過的醫(yī)生,會發(fā)現(xiàn)他們對于 AI 醫(yī)療的認知有很明顯提升」,馬立補充說道。
除了普通民眾和醫(yī)院,疫情也正在推動互聯(lián)網(wǎng)醫(yī)療相關(guān)政策的出臺,2020 年 3 月 2 日,國家醫(yī)保局、國家衛(wèi)健委兩部發(fā)布《關(guān)于推進新冠肺炎疫情防控期間開展「互聯(lián)網(wǎng)」醫(yī)保服務(wù)的指導(dǎo)意見》,明確互聯(lián)網(wǎng)醫(yī)療機構(gòu)可以為參保人在線開具電子處方,線下采取多種方式靈活配藥,參保人可享受醫(yī)保支付待遇;3 月 5 日,「互聯(lián)網(wǎng)醫(yī)療」被首次納入中央級醫(yī)保文件。
隨著「互聯(lián)網(wǎng) 醫(yī)?!拐叩慕舆B出臺,互聯(lián)網(wǎng)醫(yī)療的活力進一步激發(fā),患者的就醫(yī)觀念也在不斷發(fā)生改變。
醫(yī)療 AI 的價值在抗疫中得到驗證,會對醫(yī)療行業(yè)和公眾產(chǎn)生深遠的影響。在接下來幾年,將會看到整個醫(yī)療行業(yè)的數(shù)字化和智能化程度大幅度提升,這也將成為醫(yī)療系統(tǒng)的常態(tài):AI 助攻,人類醫(yī)生提效,華先勝補充說道。
2016 年,達摩院醫(yī)療 AI 由時任阿里巴巴 iDST 副院長的華先勝帶隊打造。
彼時人工智能熱潮剛剛掀起,行業(yè)內(nèi)對人工智能的探討還僅僅局限在技術(shù)研發(fā)上,在落地場景上基本沒有考量,具體到醫(yī)療領(lǐng)域可以在哪些場景驅(qū)動技術(shù)的落地,更是一片未知。
但當(dāng)時的華先勝堅信:人工智能進入醫(yī)療健康領(lǐng)域,是一個必然的事情,作為視覺智能領(lǐng)域深耕多年的專家,華先勝團隊從肺部 CT 影像開始切入醫(yī)療 AI,很快就做出成績。
2017 年 7 月,達摩院 AI 在國際權(quán)威的肺結(jié)節(jié)檢測大賽 LUNA16 上打破世界紀錄,憑借 89.7% 的平均召回率(在樣本數(shù)據(jù)中成功發(fā)現(xiàn)結(jié)節(jié)占比的比例)奪冠。
大賽要求選手對 888 份肺部 CT 樣本進行分析,尋找其中的肺結(jié)節(jié)。樣本共包含 1186 個肺結(jié)節(jié),75% 以上為小于 10mm 的小結(jié)節(jié)。最終,達摩院在 7 個不同誤報率下發(fā)現(xiàn)的肺結(jié)節(jié)平均召回率達到 89.7%,超出第二名 0.2%。
不同誤報次數(shù)下召回率情況
這一次「第一」儼然有著承上啟下的「里程碑」意義,為阿里達摩院新冠肺炎的 CT 自動診斷系統(tǒng)打下了基礎(chǔ),同時開啟了達摩院更加廣泛的研究范圍。
2018 年 12 月,達摩院 AI 從近百支隊伍中脫穎而出,在全球 LiTS(Liver Tumor Segmentation Challenge,肝臟腫瘤病灶區(qū) CT 圖像分割挑戰(zhàn)) 獲得兩項第一;
2019 年的心臟冠脈中心線提取鹿特丹比賽(Rotterdam)上,達摩院 AI 獲得全自動提取賽事第一名,相關(guān)論文被國際頂級醫(yī)學(xué)影像會議 MICCAI 2019 提前接收;
2019 年, 達摩院 AI 獲得 EMNLP 2019 微生物群落信息抽取比賽 (BB Task)「關(guān)系和實體聯(lián)合抽取」任務(wù)冠軍。
正是由于達摩院此前四年基礎(chǔ)研究的「厚積」,才帶來了疫情期間的從點到線到面的技術(shù)應(yīng)用,讓阿里看到了底層創(chuàng)新與產(chǎn)業(yè)土壤深度結(jié)合,不斷蝶變的可能。
而阿里健康的升級,便將發(fā)生在這些技術(shù)加持帶來的業(yè)務(wù)應(yīng)用全面爆發(fā)的背景下。