美國(guó)發(fā)布新冠病毒數(shù)據(jù)集,借力AI應(yīng)對(duì)疫情
◎ 科技日?qǐng)?bào)記者 劉霞
截至3月18日12時(shí),世界衛(wèi)生組織等權(quán)威機(jī)構(gòu)提供的數(shù)據(jù)顯示,全球新冠病毒確診人數(shù)已超過(guò)19萬(wàn)人,數(shù)千人因此喪生。
在人們想方設(shè)法應(yīng)對(duì)新冠疫情之時(shí),美國(guó)白宮和科技界意識(shí)到人工智能(AI)有望在應(yīng)對(duì)疫情方面發(fā)揮巨大作用,有鑒于此,他們攜手發(fā)布了“新冠肺炎開(kāi)放研究數(shù)據(jù)集”(CORD-19),希望借助方興未艾的AI技術(shù)的力量應(yīng)對(duì)疫情。
美發(fā)布新冠肺炎開(kāi)放數(shù)據(jù)集
據(jù)美國(guó)白宮科技政策辦公室(OSTP)網(wǎng)站16日消息,艾倫人工智能(AI)研究所、陳扎克伯格基金會(huì)(CZI)、喬治敦大學(xué)安全與新興技術(shù)中心(CSET)、微軟、美國(guó)國(guó)立衛(wèi)生研究院國(guó)家醫(yī)學(xué)圖書館(NLM),以及OSTP今日聯(lián)合發(fā)布了“新冠肺炎開(kāi)放研究數(shù)據(jù)集”。
“新冠肺炎開(kāi)放研究數(shù)據(jù)集”(CORD-19)圖標(biāo)。圖片來(lái)源:“冒險(xiǎn)節(jié)拍”網(wǎng)站
據(jù)悉,該數(shù)據(jù)集包含與新冠肺炎、新型冠狀病毒及冠狀病毒組有關(guān)的29000多篇學(xué)術(shù)文獻(xiàn),其中超過(guò)13000篇是完整文獻(xiàn)。這一數(shù)據(jù)集是迄今可用于數(shù)據(jù)和文本挖掘研究的最廣泛的機(jī)器可讀冠狀病毒文獻(xiàn)合集,將主要用于醫(yī)學(xué)和機(jī)器學(xué)習(xí)等相關(guān)領(lǐng)域研究,幫助人們更快更好地應(yīng)對(duì)新冠肺炎疫情。
白宮首席技術(shù)官邁克爾?科雷特西奧斯表示:“白宮與美國(guó)國(guó)家科學(xué)、工程與醫(yī)學(xué)研究院及世界衛(wèi)生組織合作,確定了數(shù)十個(gè)與新冠肺炎有關(guān)的科學(xué)問(wèn)題,人工智能有望幫助科學(xué)家盡快而且全面地總結(jié)和分析信息,最終提出應(yīng)對(duì)方案?!?/p>
科雷特西奧斯進(jìn)一步說(shuō):“美國(guó)科技企業(yè)的果決行動(dòng)對(duì)于預(yù)防、檢測(cè)、治療和開(kāi)發(fā)新冠肺炎療法至關(guān)重要,我們呼吁人工智能專家采取行動(dòng),開(kāi)發(fā)新的文本和數(shù)據(jù)挖掘技術(shù),幫助科學(xué)界回答與新冠肺炎有關(guān)的最緊迫的科學(xué)問(wèn)題。”
借AI提升文獻(xiàn)檢索速度
微軟首席科學(xué)官埃里克?霍維茨表示:“我們創(chuàng)建此開(kāi)放數(shù)據(jù)集的目的是啟發(fā)和激勵(lì)A(yù)I界研發(fā)新工具,幫助科學(xué)家快速掌握成千上萬(wàn)篇文獻(xiàn)的重點(diǎn)和精髓,以更快更好地找到應(yīng)對(duì)新冠肺炎疫情的措施和方法?!?/p>
霍維茨強(qiáng)調(diào)說(shuō):“生物醫(yī)學(xué)領(lǐng)域每年將有100多萬(wàn)種出版物發(fā)表,AI作為科學(xué)家‘左膀右臂’的重要性也日益凸顯?!?/p>
研究人員稱,通過(guò)機(jī)器學(xué)習(xí)技術(shù),借助CORD-19開(kāi)放數(shù)據(jù)集,科學(xué)家可以節(jié)約更多時(shí)間。AI會(huì)學(xué)習(xí)科學(xué)家想要了解的內(nèi)容,在龐大的數(shù)據(jù)集中找到每個(gè)科學(xué)家所需的內(nèi)容,從而大大縮小檢索范圍和文本規(guī)模。
各種AI工具紛紛登場(chǎng)
在應(yīng)對(duì)疫情方面,各種形式的AI都有望“大顯身手”,其中最突出的是自然語(yǔ)言處理(NLP)技術(shù)。
例如,艾倫人工智能研究所的語(yǔ)言模型ELMO和 AllenNLP有助科學(xué)家理解不同論文內(nèi)容之間的關(guān)系。該機(jī)構(gòu)語(yǔ)言學(xué)家道格?雷蒙德說(shuō):“過(guò)去幾年,我們?cè)谧匀徽Z(yǔ)言處理方面取得了長(zhǎng)足進(jìn)步,CORD-19這類數(shù)據(jù)集的實(shí)用性可能會(huì)比幾年前更大,因?yàn)楝F(xiàn)在我們有了更多可用的工具。”
據(jù)國(guó)外媒體報(bào)道,目前有多個(gè)團(tuán)隊(duì)使用NLP技術(shù)對(duì)抗冠狀病毒。例如,美國(guó)哈佛醫(yī)學(xué)院開(kāi)發(fā)出了一種工具,可以評(píng)估患者的病例、社交媒體和健康衛(wèi)生數(shù)據(jù)。此外,一家名為“藍(lán)點(diǎn)”(BlueDot)的公司使用NLP工具來(lái)搜尋新聞報(bào)道、公共健康數(shù)據(jù)和其他資源,在新冠肺炎疫情爆發(fā)之初發(fā)揮了監(jiān)測(cè)功能。
無(wú)獨(dú)有偶,中國(guó)疾病預(yù)防控制中心的工作人員也在使用阿里巴巴達(dá)摩院最新的NLP技術(shù)開(kāi)展病歷文本分析和流行病學(xué)調(diào)查工作,而且,達(dá)摩院的StructBERT模型上周被評(píng)為全球性能最強(qiáng)的NLP系統(tǒng)。
除NLP,其它形式的AI技術(shù)也不甘示弱,紛紛登場(chǎng),在應(yīng)對(duì)新冠疫情中各展所長(zhǎng)。比如,消毒機(jī)器人可以幫助醫(yī)護(hù)人員進(jìn)行疫區(qū)消毒;深度學(xué)習(xí)技術(shù)可以幫助醫(yī)生預(yù)測(cè)死亡率等數(shù)據(jù)指標(biāo);而圖像識(shí)別技術(shù)可以讓醫(yī)護(hù)人員更快地根據(jù)CT圖像識(shí)別出新冠肺炎患者。
此外,世界各國(guó)各地政府也紛紛采用各種技術(shù)來(lái)應(yīng)對(duì)疫情,比如GPS跟蹤、自我篩選應(yīng)用程序、文本警報(bào)及智能手機(jī)跟蹤等。其他正在開(kāi)展的舉措包括:加拿大抗體研發(fā)公司Abcellera正與美國(guó)高級(jí)研究計(jì)劃局(DARPA)的大流行病預(yù)防平臺(tái)攜手研制抗體;旨在阻止疫情在60天內(nèi)暴發(fā)的“使預(yù)防和治療成為可能的自動(dòng)診斷”(ADEPT)項(xiàng)目等。
谷歌首席執(zhí)行官桑達(dá)爾?皮查伊周日宣布,谷歌公司正與政府合作創(chuàng)建一個(gè)網(wǎng)站,幫助人們自我篩查,然后決定是否要尋醫(yī)問(wèn)藥;Alphabet旗下的生命科學(xué)部門Verily則正在研發(fā)新型冠狀病毒檢測(cè)工具。
艾倫人工智能研究所所長(zhǎng)奧倫?埃奇奧尼表示,人工智能可以幫助科學(xué)家加快進(jìn)度并找到解決問(wèn)題的答案。但他也強(qiáng)調(diào),人工智能只能增強(qiáng)人類的能力,不會(huì)自行解決問(wèn)題。
微軟、白宮和艾倫研究所等發(fā)布的冠狀病毒數(shù)據(jù)集首發(fā)于美國(guó)科技博客網(wǎng)站“冒險(xiǎn)節(jié)拍”(Venture Beat)。
來(lái)源:科技日?qǐng)?bào)
編輯:張爽
審核:朱麗
終審:冷文生