美國公開新冠數(shù)據(jù)集欲借力AI,人工智能如何參與全球戰(zhàn)“疫”?
編者按:本文來自微信公眾號“讀芯術(shù)”(ID:AI_Discovery),作者:讀芯術(shù),36氪經(jīng)授權(quán)發(fā)布。
截至北京時間3月22日6時,全球累積確診病例超30萬,死亡病例近13萬,這場來勢洶洶的疫情在世界范圍內(nèi)持續(xù)蔓延。國內(nèi)“重災(zāi)區(qū)”湖北已連續(xù)4天無新增病例,而世界的防疫戰(zhàn)爭才剛剛開始。
歐洲已成世界新冠疫情中心,意大利累計確診過5萬,政府同意派遣軍隊進入倫巴第大區(qū)協(xié)助抗疫;美國的情況也不容樂觀,特朗普宣布疫情嚴(yán)重的紐約州出現(xiàn)“重大災(zāi)難”,這場防疫戰(zhàn)已然成為世界人民共同的“健康守衛(wèi)戰(zhàn)”。
圖源:goabroad.xdf.cn
前幾日,美國白宮與微軟、谷歌等公司合作,匯編了最大的新冠病毒學(xué)術(shù)論文庫,呼吁研究人員用AI技術(shù)分析這近3萬篇學(xué)術(shù)論文,期望發(fā)現(xiàn)人類可能錯過的重要問題。
除此之外,預(yù)測研判、檢測診療、疫情防控,這套AI“組合拳”還亮出了不少花式操作。
發(fā)布病毒數(shù)據(jù)集,激活全球AI力量
根據(jù)美國白宮官網(wǎng)報道,3月16日,艾倫AI研究所、微軟研究院、美國國立衛(wèi)生研究院下屬國家醫(yī)學(xué)圖書館、白宮科學(xué)技術(shù)辦公室等聯(lián)合發(fā)布了COVID-19開放獲取數(shù)據(jù)庫,其中包含了有關(guān)COVID-19、SARS-CoV-2及冠狀病毒家族的學(xué)術(shù)論文。
CORD-19 logo | 圖源:geekwire.com
這一數(shù)據(jù)庫向全球研究人員開放,并會隨著同行評議新研究的發(fā)表不斷更新。數(shù)據(jù)集的發(fā)布當(dāng)然不只是為了整理和存檔,挖掘更有用的信息才是目的所在。這是目前可用于數(shù)據(jù)和文本挖掘的最全面的新冠文獻機讀數(shù)據(jù)庫。白宮號召全美的人工智能專家行動起來,運用AI技術(shù)分析這些論文,幫助解答新冠病毒最緊迫的疑難問題。
數(shù)據(jù)庫一經(jīng)開放,谷歌云旗下的機器學(xué)習(xí)和數(shù)據(jù)科學(xué)社區(qū)Kaggle立即發(fā)起了CORD-19數(shù)據(jù)集文本挖掘競賽。Kaggle在官網(wǎng)上發(fā)布了10個問題,涵蓋冠狀病毒特性、新冠病毒危險因素、病毒傳播和診療、疫苗、非藥物干預(yù)、信息共享和跨部門合作以及社科倫理等方面,每項問題中最符合評估標(biāo)準(zhǔn)的人員將獲得1000美元的獎金。
圖源:sg.channelasia.tech
正如艾倫AI研究所所長Oren Etzioni所說,人工智能本身不能解決問題,但能幫助人們更快速地發(fā)掘問題的答案。美國首席技術(shù)官邁克爾·克拉希歐斯也表示,他們希望計算機能夠比人類更快地掃描研究結(jié)果,發(fā)現(xiàn)人類可能錯過的東西。AI已經(jīng)成為科學(xué)家重要的左膀右臂。
機器學(xué)習(xí)技術(shù)在大量文本中提取摘要,有時需要分析數(shù)百萬個相似的內(nèi)容項才能得出結(jié)論。想要發(fā)揮數(shù)據(jù)集更大的作用,自然語言處理(NLP)技術(shù)的進步不容忽視。例如,艾倫AI研究所的語言模型ELMO和AllenNLP,能夠分析不同論文之間的關(guān)系;阿里達(dá)摩院將NLP技術(shù)用于病歷文本分析,這個模型也被評為全球性能最強的NLP系統(tǒng)。
Blue Dot Explorer | 圖源:diginomica.com
此外,NLP技術(shù)的作用還體現(xiàn)在疫情預(yù)警上。12月30日,波士頓兒童醫(yī)院的自動健康地圖系統(tǒng)發(fā)布了境外關(guān)于新冠病毒的首次公共警報。31日,加拿大AI創(chuàng)業(yè)公司Blue Dot也向客戶發(fā)出了疫情警告——“避開武漢等危險區(qū)域”,早于CDC和WHO的通報。
Blue Dot的健康監(jiān)控平臺對數(shù)十億個數(shù)據(jù)點進行分析,找出相關(guān)詞匯短語,從而預(yù)測傳染病的爆發(fā),還可以預(yù)測病毒的傳播。據(jù)《華爾街日報》報道,其信息來源包括:國內(nèi)外每日新聞稿10萬+、官方報告、衛(wèi)星氣候數(shù)據(jù)、航班信息和包括人口數(shù)據(jù)、醫(yī)療力量和可傳播傳染病的昆蟲數(shù)據(jù)在內(nèi)的政府資源。這不是Blue Dot第一次預(yù)測成功,利用類似的AI技術(shù),他們還曾準(zhǔn)確預(yù)測了埃博拉病毒和巴西寨卡病毒的遷移。
海量數(shù)據(jù)+最強大腦,AI技術(shù)讓病毒無處遁形。
圖源:thesouthafrican.com
疫情之下,醫(yī)療AI化身可靠援軍
不僅是作為“場外輔助”,AI還在戰(zhàn)場上與新冠病毒正面交鋒。
知己知彼,百戰(zhàn)不殆。曾經(jīng)開發(fā)了AlphaGo的DeepMind正在執(zhí)行一項新任務(wù):找出這種新型冠狀病毒的某些特性。DeepMind已發(fā)表的一篇文章中稱,已經(jīng)將AlphaFold系統(tǒng)用于新冠病毒的蛋白質(zhì)結(jié)構(gòu),這種“自由建模”的機器學(xué)習(xí)技術(shù)能夠在沒有相似蛋白質(zhì)結(jié)構(gòu)的先驗知識時,提供準(zhǔn)確的預(yù)測。
圖源:www.datanami.com
DeepMind表示,雖然這些預(yù)測尚未得到驗證,但能夠幫助研究人員更充分地理解新冠病毒,這可能在開發(fā)疫苗或治療時有用。
也有研究人員利用人工智能技術(shù)進行抗病毒藥物的篩查,AI公司Deargen與韓美高校的研究人員合作進行這一工作。他們公布了針對抗病毒藥物的預(yù)測模型,并在預(yù)測后對FDA批準(zhǔn)的約4000種市售藥物進行了測試。研究表明,用于治療和預(yù)防艾滋病毒的抗逆轉(zhuǎn)錄病毒藥物阿扎那韋最有希望能被用于臨床。這一基于深度學(xué)習(xí)的“藥物-靶標(biāo)”相互作用的模型,旨在預(yù)測藥物和蛋白質(zhì)之間的親和力得分。
DeepMind CEO Demis Hassabis | 圖源:IT之家
Deargen首席技術(shù)官樸成秀表示,這種方法能夠以更快的速度和更少的成本,利用AI來預(yù)測吸收、分布、代謝、排泄和毒性,可將范圍擴大到有效且相對安全的候選藥物中。
英國AI醫(yī)療領(lǐng)域的獨角獸Benevolent AI,也在柳葉刀上發(fā)表短文,公布了AI分析和篩選抗新冠病毒藥物的發(fā)現(xiàn)。通過靶向內(nèi)吞,AI發(fā)現(xiàn)了四種潛在藥物能夠抑制病毒內(nèi)吞,排除較強的副作用后,結(jié)果表明 Baricitinib可作為一種抗新冠病毒的候選藥物。據(jù)CNN報道,IBM研發(fā)的配備AI超級大腦的Summit,已經(jīng)辨識到77種可能有效阻止新冠病毒蔓延的藥物成分。
圖源:www.jianshu.com
此外,AI醫(yī)療在戰(zhàn)疫中的重要性還體現(xiàn)在輔助診斷方面。谷歌母公司Alphabet旗下醫(yī)療部門Verily推出了新冠病毒篩查項目,上線第一天測試了20多人。微軟與CDC合作構(gòu)建了一個聊天機器人——“冠狀病毒自我檢查器”,可以指導(dǎo)用戶初步判斷自己是否感染。日本的Doctor-NET也將開啟AI檢測新型冠狀病毒的試驗,將與北京推想科技合作,引進這套根據(jù)CT圖像進行檢測的系統(tǒng)。
圖源:techtimes.com
事實上,國外將AI醫(yī)療技術(shù)運用在傳染病防治的案例早已有之。早在2008年,谷歌就推出了流感趨勢服務(wù);美國國家過敏和傳染病研究所曾資助“配體搜索算法”項目,旨在用AI程序設(shè)計藥物;2013年IBM就開始研究如何運用AI系統(tǒng)“沃森”提高護理水平,谷歌的監(jiān)測工具LYNA將乳腺癌診斷的時間縮短了一半,準(zhǔn)確率達(dá)到99%。
技術(shù)迅猛發(fā)展,AI醫(yī)療成為我們防疫戰(zhàn)中最堅實的后盾。
中國經(jīng)驗+技術(shù),助力全球AI戰(zhàn)疫
中國一個多月來的艱苦鏖戰(zhàn)如今為各國提供了“抄作業(yè)”的范本。中國駐韓大使館援助韓國大邱物資上寫到:“道不遠(yuǎn)人,人無異國”,在國內(nèi)疫情得到控制的同時,中國又馬不停蹄地投入了全球共同的防疫戰(zhàn)之中。不僅提供物資、醫(yī)護人員以及“山川異域,風(fēng)月同釘”,還有寶貴經(jīng)驗和AI技術(shù)。
圖源:geekpark.net
近日,百度頻頻被外媒“點名”報道,肯定其AI抗疫的勝利,《麻省理工科技評論》也發(fā)表關(guān)于百度AI戰(zhàn)疫的報道,全球疫情升級之下中國經(jīng)驗顯得尤為寶貴。MIT的文章涉及百度 AI 技術(shù)在病毒分析、實時篩查、輔助診療、大數(shù)據(jù)分析等方面的應(yīng)用成果,還包括自動駕駛車輛在無接觸作業(yè)方面的應(yīng)用。文章認(rèn)為“此次疫情中展現(xiàn)出的數(shù)字鏈接,其規(guī)模是傳染病史上前所未有的”,這些經(jīng)驗也為全球疫情防控提供了思路。
圖源:@百度
不止于經(jīng)驗,更有實實在在的技術(shù)支持。疫情爆發(fā)初期,百度就向全球科研中心免費開放了算法Linear Fold,以及世界上現(xiàn)有最快的RNA結(jié)構(gòu)預(yù)測網(wǎng)站,其可將新冠病毒的全基因組二級結(jié)構(gòu)預(yù)測從55秒縮短至27秒,助力全球疫情防控。
阿里也聯(lián)合全球健康藥物研發(fā)中心,開發(fā)AI藥物研發(fā)和大數(shù)據(jù)平臺,實時公布;阿里云宣布向全球公共科研機構(gòu)免費開放一切AI算力,用以加速新藥和疫苗的研發(fā)。3月19日,阿里再一次宣布向全球醫(yī)院免費開放新冠肺炎AI診斷技術(shù),達(dá)摩院的CT影像AI可在20秒內(nèi)完成一次診斷,最快僅用2秒,準(zhǔn)確率高達(dá)96%以上。
圖源:北京日報
推想科技與武漢同濟醫(yī)院、中南醫(yī)院聯(lián)合研發(fā)的新冠肺炎“CR+AI”輔助篩查和疫情監(jiān)測系統(tǒng),也遠(yuǎn)赴意大利、日本的抗疫一線。意大利已然成為全球疫情的“震中,其醫(yī)療系統(tǒng)正面對極大壓力,推想科技的CT+AI為疫情篩查構(gòu)筑起了一道防線。
不過在病毒肆虐全球的當(dāng)下,世界范圍內(nèi)基于AI技術(shù)的醫(yī)療研究只能是輔助作用,成效不顯,正所謂“遠(yuǎn)水難救近火”。面對這次疫情,AI技術(shù)原本為人稱道的預(yù)測功能卻未能派上用場。盡管Blue Dot早在12月底就發(fā)出疫情預(yù)警,甚至預(yù)測到病毒有傳播到新加坡、東京、香港等地的風(fēng)險,卻未能引起足夠重視。
也許,這次疫情給人類最大的教訓(xùn)和提醒,就是全人類該如何通力合作,去建立一個權(quán)威、準(zhǔn)確的全球衛(wèi)生“哨兵系統(tǒng)”,這才是未來AI技術(shù)在醫(yī)療領(lǐng)域發(fā)展的重中之重。