阿里云ET醫(yī)療大腦上線:用人工智能挑戰(zhàn)癌癥
3月29日,在阿里云棲大會(huì)·深圳峰會(huì)上,ET醫(yī)療大腦正式上線。在浩如煙海的DNA序列中,比對(duì)識(shí)別出發(fā)生突變的基因位點(diǎn);繼承成百上千位影像學(xué)專家的“眼力”,在CT、核磁、B超或X光暗黑的器官/組織剖面成像上,捕捉毫米級(jí)的小病灶,時(shí)間可縮短至1分鐘內(nèi)……
這一切,并非科幻,而是多個(gè)科學(xué)團(tuán)隊(duì),依托病例大數(shù)據(jù),不斷創(chuàng)新改良的復(fù)雜運(yùn)算方法,和阿里云提供的開(kāi)放式“天池眾智”平臺(tái),賦予ET醫(yī)療大腦的“超能力”。
其中,針對(duì)甲狀腺結(jié)節(jié)開(kāi)發(fā)的影像學(xué)診斷系統(tǒng),已進(jìn)駐浙江大學(xué)附屬第一醫(yī)院等醫(yī)療機(jī)構(gòu)“實(shí)習(xí)”,輔助那里的超聲影像科醫(yī)生閱片、捕捉甲狀腺結(jié)節(jié),并出具診斷報(bào)告。
至今,幾個(gè)月的前期臨床實(shí)踐驗(yàn)證表明,成長(zhǎng)于阿里云端的ET醫(yī)療大腦,可以用幾十秒甚至更短的時(shí)間, 幫助醫(yī)生完成一張甲狀腺B超的閱片工作,圈出結(jié)節(jié)區(qū)域,并給出良性或惡性的判斷。過(guò)去,有經(jīng)驗(yàn)的超聲科醫(yī)生從閱片到書寫診斷報(bào)告,至少需要20分鐘。
在阿里云對(duì)其人工智能ET的賦能規(guī)劃中,除了之前廣為傳播的“讀心術(shù)”、魔術(shù)師、陸空交通指揮中樞、信息安全攻防外,醫(yī)療能力,尤其是對(duì)甲狀腺、肺癌等現(xiàn)代社會(huì)高發(fā)疾病的風(fēng)險(xiǎn)預(yù)測(cè)、防控、診治能力,顯得更為重要、緊迫,也令人振奮。
“在多個(gè)疾病的(大數(shù)據(jù)運(yùn)算)測(cè)試中,我們意識(shí)到機(jī)器能夠深度學(xué)習(xí)并掌握人眼觀察圖像、識(shí)別差異的能力,并且能夠與人類醫(yī)生做得一樣好!”阿里云智能科學(xué)家閔萬(wàn)里說(shuō),至少在一些可以將醫(yī)學(xué)影像作為主要診斷依據(jù)的疾病領(lǐng)域,比如甲狀腺結(jié)節(jié),肺部結(jié)節(jié),人工智能武裝的機(jī)器人,“完全可以成為醫(yī)生的助手”,并以低成本,快速的提高診療工作效率。
除了對(duì)CT、核磁、B超的醫(yī)學(xué)影像診斷學(xué)習(xí),阿里云還聯(lián)合英特爾、和華大基因等來(lái)自計(jì)算機(jī)、生物醫(yī)學(xué)領(lǐng)域的頂尖企業(yè)和創(chuàng)業(yè)公司,整合基因檢測(cè)大數(shù)據(jù),共同研究肺癌等疾病與基因突變的強(qiáng)相關(guān)性,試圖通過(guò)ET的深度學(xué)習(xí),精準(zhǔn)定位導(dǎo)致疾病發(fā)生的突變基因位點(diǎn)(靶點(diǎn)),最終輔助醫(yī)生為患者提供個(gè)體化的治療方案,指導(dǎo)精準(zhǔn)用藥。
在阿里云的人工智能規(guī)劃布局中,ET將具備多項(xiàng)醫(yī)療能力,可在疾病風(fēng)險(xiǎn)預(yù)測(cè)、醫(yī)學(xué)影像診斷、精致治療方案、藥效挖掘、新藥研發(fā)、疾病監(jiān)測(cè)及健康管理等多個(gè)領(lǐng)域,擔(dān)當(dāng)“醫(yī)生助手”。
在先期入駐阿里云ET醫(yī)療大腦的技術(shù)中,浙江大學(xué)孔德興教授團(tuán)隊(duì)研發(fā)的超聲影像的智能診斷算法是佼佼者。
突破:萬(wàn)份病歷深度學(xué)習(xí),“機(jī)器眼”比“肉眼”準(zhǔn)確率提高25%
“智能診斷的基礎(chǔ),是大數(shù)據(jù)”,孔教授介紹,這套技術(shù)在誕生之前,首先對(duì)來(lái)自各類醫(yī)療機(jī)構(gòu)的,1萬(wàn)張以上由經(jīng)驗(yàn)醫(yī)生準(zhǔn)確標(biāo)注(定位)結(jié)節(jié)位置的甲狀腺B超,進(jìn)行了深度學(xué)習(xí)。
在海量“記憶”的基礎(chǔ)上,研究團(tuán)隊(duì)在運(yùn)算系統(tǒng)中加入旋轉(zhuǎn)不變性等現(xiàn)代數(shù)學(xué)概念,調(diào)整了卷集網(wǎng)絡(luò)結(jié)構(gòu),讓用于捕捉結(jié)節(jié)的“機(jī)器眼”變的更靈敏,用于判斷結(jié)節(jié)良性或惡性的“機(jī)器腦”變得更“聰明”。
2016年,從浙江大學(xué)附屬第一醫(yī)院超聲影像科開(kāi)始,這項(xiàng)技術(shù)先后“入駐”火箭軍醫(yī)院、杭州市流霞街道社區(qū)衛(wèi)生服務(wù)中心和一些在線問(wèn)診平臺(tái),開(kāi)始對(duì)甲狀腺結(jié)節(jié)的檢出率和準(zhǔn)確率進(jìn)行臨床驗(yàn)證。
多年來(lái),甲狀腺結(jié)節(jié)的主要診斷方法,是B超檢查。在諸多醫(yī)學(xué)影像檢查手段中,B超成本低、檢查地點(diǎn)/時(shí)間靈活、出片實(shí)時(shí),但影像的收集和識(shí)別,嚴(yán)重依賴于醫(yī)生的經(jīng)驗(yàn)與手法,比CT、MRI等其它影像更難處理。
來(lái)自我國(guó)三甲醫(yī)院的臨床抽樣調(diào)查顯示,甲狀腺結(jié)節(jié)的平均診斷正確率只有60%,多需患者切除結(jié)節(jié)后再進(jìn)行活檢(病理學(xué)檢查),才能診斷結(jié)節(jié)是良性還是惡性?!叭绻蛔龌顧z,不同的醫(yī)生常有不同的判斷”,浙一醫(yī)院超聲科副主任趙齊羽坦言,結(jié)節(jié)的良惡性在B超片子上并非一清二楚的,一些良性的結(jié)節(jié)會(huì)帶有惡性的特征,一些惡性的結(jié)節(jié)同樣會(huì)有良性的表現(xiàn)。
然而,在前期的“臨床試驗(yàn)”中,機(jī)器對(duì)約2000張B超圖像中,甲狀腺結(jié)節(jié)的檢查率超過(guò)90%,良/惡性判斷的準(zhǔn)確率也高達(dá)85%以上。
“檢出率和準(zhǔn)確率的提高,大幅減輕了醫(yī)生機(jī)械性重復(fù)的工作良,縮短患者等待檢查報(bào)告的時(shí)間,尤其是改變了過(guò)去基層醫(yī)院可以做B超,但缺乏診斷能力的困境?!笨椎滦越邮芡嘎?,目前,杭州市西湖區(qū)西溪街道等多家社區(qū)衛(wèi)生服務(wù)中心,都希望引進(jìn)超聲機(jī)器人,作為醫(yī)生的診療“助手”
超聲智能診斷工作,與醫(yī)生為患者實(shí)施B超檢查同步進(jìn)行,智能診斷系統(tǒng)會(huì)自動(dòng)地將圖像采集下來(lái),“捕捉”結(jié)節(jié)的準(zhǔn)確位置,并在幾十秒的時(shí)間內(nèi),比照深度學(xué)習(xí)總結(jié)出的一系列指標(biāo),判斷結(jié)節(jié)是良性還是惡性,同步向醫(yī)生出具報(bào)告。對(duì)這些運(yùn)算結(jié)果的準(zhǔn)確行,機(jī)器人還會(huì)自己賦予一個(gè)概率值,為醫(yī)生最終的診斷,提供參考。
不僅是甲狀腺結(jié)節(jié),基于人工智能對(duì)人眼識(shí)別影像細(xì)微差異并做出判斷的深度學(xué)習(xí)能力,阿里云平臺(tái)上,又孵化出對(duì)肺腺癌基本特征——肺部結(jié)節(jié)的智能診斷系統(tǒng)。
阿里云算法工程師行湘介紹,人工智能診斷的原理,就是設(shè)計(jì)算法識(shí)別模型,賦予機(jī)器深度學(xué)習(xí)的計(jì)算能力;同時(shí),收集大量有病灶位置準(zhǔn)確標(biāo)注的醫(yī)學(xué)影像數(shù)據(jù),訓(xùn)練機(jī)器的記憶比對(duì)和識(shí)別能力,最終代替醫(yī)生閱讀CT、核磁、X光,B超等醫(yī)學(xué)影像,輔助醫(yī)生做出診斷。
“理論上,全身各臟器的各類影像學(xué)圖像及其它醫(yī)學(xué)海量數(shù)據(jù)都有可能被深度挖掘。”行湘說(shuō)。
聚合:通過(guò)有獎(jiǎng)擂臺(tái)賽 阿里云ET要集醫(yī)學(xué)AI百家所長(zhǎng)
“眾智,才是最好的。”基于在電商、物流、交通、金融、信息安全等多個(gè)領(lǐng)域“打擂招賢”式比較研究的經(jīng)驗(yàn)積累,阿里云推出“天池”平臺(tái),計(jì)劃打造一個(gè)開(kāi)放式的應(yīng)用型人工智能“孵化”平臺(tái)。
具體到ET醫(yī)療大腦的塑造與完善,考慮到醫(yī)療領(lǐng)域的專業(yè)壁壘,阿里云更寄望于“眾智出英雄”。
顧斐,在哈佛大學(xué)醫(yī)學(xué)院做博士后研究的年輕人進(jìn)入阿里云,開(kāi)始從事肺腺癌的基因突變“追蹤”研究。
在顧斐看來(lái),目前,國(guó)內(nèi)從事基因檢測(cè),特別是癌癥基因測(cè)序的機(jī)構(gòu)很多,但解讀探究DNA序列片段的方法,偏向統(tǒng)計(jì)學(xué)。但在像谷歌、IBM這樣的國(guó)際頂尖互聯(lián)網(wǎng)科技企業(yè),已經(jīng)通過(guò)大數(shù)據(jù)運(yùn)算能力,和人工智能機(jī)器的深度學(xué)習(xí)能力,結(jié)合大量的基因檢測(cè)樣本,去研究預(yù)測(cè)疾病與基因突變的關(guān)系。
“通過(guò)機(jī)器對(duì)大數(shù)據(jù)的深度學(xué)習(xí),搞清楚哪個(gè)(基因)突破的位點(diǎn),與疾病的發(fā)生有強(qiáng)相關(guān)性——這種研究的應(yīng)用前景是,可以對(duì)疾病的風(fēng)險(xiǎn)進(jìn)行預(yù)測(cè),可以通過(guò)靶向指標(biāo)診斷疾病,還可以給予精準(zhǔn)的個(gè)性化的用藥指導(dǎo)。”回到中國(guó)前,顧斐研究了國(guó)內(nèi)的醫(yī)療人工智能格局,最終,綜合計(jì)算能力,和平臺(tái)的包容性(對(duì)大數(shù)據(jù)的存儲(chǔ)能力和存儲(chǔ)效率),選擇進(jìn)駐阿里云ET醫(yī)療大腦,開(kāi)展他對(duì)肺腺癌防治的深入研究。
過(guò)去18個(gè)月,阿里云與英特爾、華大基因合作共建的精準(zhǔn)醫(yī)療項(xiàng)目BGI Online也在做這方面的探索。
此前,華大基因、阿里云和安徽醫(yī)科大學(xué)共同宣布,在21小時(shí)47分12秒內(nèi)完成了1000例人類全外顯子組數(shù)據(jù)的分析。40年前,人類若想對(duì)埃希氏大腸桿菌進(jìn)行全基因組測(cè)序,需要1000年的時(shí)間。
“在系統(tǒng)架構(gòu)上,我們將ET醫(yī)療大腦設(shè)置為一個(gè)開(kāi)放的人工智能系統(tǒng)。阿里云自身有大量的醫(yī)學(xué)與人工智能科學(xué)家投入到研發(fā)當(dāng)中,但我們更希望能吸收外部精良的算法與醫(yī)學(xué)經(jīng)驗(yàn),只有如此,ET才能集百家所長(zhǎng)”,閔萬(wàn)里說(shuō)。
與正式推出ET醫(yī)療大腦同日,阿里云宣布,聯(lián)合英特爾、linkdoc(零氪科技,一家致力于腫瘤大數(shù)據(jù)研究的創(chuàng)業(yè)公司)啟動(dòng)天池醫(yī)療AI系列賽,啟動(dòng)為期三年的醫(yī)學(xué)AI算法眾智比賽。第一季比賽,圍繞全球第一高發(fā)惡性腫瘤——肺癌展開(kāi)。
阿里云大數(shù)據(jù)孵化器——天池平臺(tái)負(fù)責(zé)人王一婷介紹,在國(guó)家衛(wèi)生計(jì)生委的指導(dǎo)下,通過(guò)與全國(guó)20多家大型腫瘤醫(yī)院基于醫(yī)學(xué)研究戰(zhàn)略結(jié)盟,天池將為這一季的眾智比賽,提供海量的脫敏后高分辨率胸部CT掃描數(shù)據(jù)。
根據(jù)賽事設(shè)計(jì),參賽選手/團(tuán)隊(duì)需要通過(guò)整合原始的CT影像數(shù)據(jù),訓(xùn)練模型算法總結(jié)提煉結(jié)節(jié)特征,最終實(shí)現(xiàn)對(duì)快速閱讀、分析CT影像圖片的能力,并對(duì)肺部結(jié)節(jié)做出智能化的捕捉,和良/惡性判斷。
“通過(guò)這樣的眾智比賽,我們希望選拔在醫(yī)學(xué)人工智能領(lǐng)域有計(jì)算能力和創(chuàng)新模型的優(yōu)秀工程師/研發(fā)團(tuán)隊(duì),進(jìn)駐阿里云ET醫(yī)療大腦,共同挑戰(zhàn)肺癌等發(fā)病率不斷攀升,對(duì)人類健康威脅越來(lái)越大的疾病?!蓖跻绘谜f(shuō),對(duì)眾智比賽中脫穎而出的參賽者/團(tuán)隊(duì),天池平臺(tái)不僅提供高額的獎(jiǎng)金,還將提供多種軟、硬件的“孵化”服務(wù)。
具體到ET醫(yī)療大腦的研發(fā),閔萬(wàn)里介紹,聚集在阿里云端的科學(xué)家和開(kāi)發(fā)者,不需要自己去總結(jié)疾病診療規(guī)律(也就是對(duì)解題方法進(jìn)行編碼),而是通過(guò)海量的脫敏病歷數(shù)據(jù)作為示例,來(lái)訓(xùn)練機(jī)器完成特定的深度學(xué)習(xí)任務(wù),自己“摸索”出解題方法。科學(xué)家要做的,是優(yōu)化算法和提供大量的訓(xùn)練數(shù)據(jù)。
去年,上海華山醫(yī)院宣布,借助阿里云的能力,用數(shù)字化模型代替部分臨床實(shí)驗(yàn),以及模擬小白鼠的活體實(shí)驗(yàn),加快特效藥的研發(fā)。
左布啦希望,以醫(yī)學(xué)AI算法眾智大賽為契機(jī),吸引更多醫(yī)療機(jī)構(gòu)、醫(yī)生群體,以及醫(yī)療政策制定者對(duì)人工智能診療的關(guān)注,共同推動(dòng)行業(yè)變革。
而顧斐的理想是,能夠與來(lái)自各地的人工智能科學(xué)家和生物醫(yī)學(xué)專家一起,在阿里云上,設(shè)計(jì)搭建一個(gè)用于重大疾病預(yù)測(cè),和后續(xù)精準(zhǔn)診斷、治療、以及可實(shí)現(xiàn)個(gè)性化用藥指導(dǎo)的知識(shí)學(xué)習(xí)模型。
“這個(gè)模型,要比世界上的主要模型算法更為精確?!鳖欖痴f(shuō)。