人工智能不僅僅在改變人們的生活方式,也在改變科學(xué)家做研究的方式。
近日,北京大學(xué)人民醫院在其官網(wǎng)宣布,該院研究團隊利用人工智能方法協(xié)助確定中國及美國初步診斷糖尿病人群的糖尿病分型,為糖尿病的精準治療提供了理論依據。
人工智能學(xué)會(huì )下圍棋、沖咖啡、打乒乓球就已賺足人氣,干嘛要做協(xié)助確定糖尿病分型這種深奧的事情呢?因為,科學(xué)家需要它們。
正在成為得力助手
人工智能感興趣的深奧領(lǐng)域,不光是協(xié)助醫學(xué)專(zhuān)家確定糖尿病分型。
DeepMind公司之前公布的“阿爾法折疊”人工智能系統,就引起不少關(guān)注。與“阿爾法狗”不同,“阿爾法折疊”的特長(cháng)是通過(guò)基因序列來(lái)預測蛋白質(zhì)的3D結構。
這可絕非易事。因為DNA信息只告訴科學(xué)家蛋白質(zhì)的基礎構成即氨基酸殘基的序列。氨基酸殘基會(huì )形成長(cháng)長(cháng)的鏈狀結構,預測這些鏈狀結構如何折疊成蛋白質(zhì)成了生物學(xué)領(lǐng)域的大難題——蛋白質(zhì)折疊問(wèn)題。
偏偏預測蛋白質(zhì)折疊對科學(xué)家而言非常有用:不但有助于理解蛋白質(zhì)形狀在人體中扮演的角色,還有助于診療與蛋白質(zhì)錯誤折疊有關(guān)的疾病,如阿爾茲海默癥、帕金森綜合征等。
傳統做法是靠大量實(shí)驗來(lái)確定蛋白質(zhì)結構。DeepMind公司的解決之道是,對深度神經(jīng)網(wǎng)絡(luò )進(jìn)行訓練,使“阿爾法折疊”能夠根據基因序列數據來(lái)預測蛋白質(zhì)的物理特征,包括蛋白質(zhì)內部?jì)蓚€(gè)氨基酸之間的距離,以及連接氨基酸化學(xué)鍵的角度。最終實(shí)現精準預測蛋白質(zhì)3D結構。
與北京大學(xué)人民醫院的科研團隊一樣,不少科研人員開(kāi)始把人工智能當做得力助手。
北科院北京市計算中心副研究員裴智勇告訴科技日報記者,他已經(jīng)與一些醫院合作,運用人工智能算法進(jìn)行了幾項醫學(xué)領(lǐng)域的研究。
其中一項研究是判斷腎病病人是糖尿病腎病還是非糖尿病腎病。因為二者雖然都是腎病,但致病機制不同,治療方法也不同。傳統的判斷方法是做腎穿刺,但這種方法比較痛苦,成本也高。裴智勇介紹,他們希望通過(guò)憑借一些醫學(xué)檢查指標來(lái)直接判斷。
“我們構建了一個(gè)機器學(xué)習模型,運用人工智能算法對病人的幾十種檢查指標進(jìn)行大數據分析,來(lái)預測是糖尿病腎病還是非糖尿病腎病?!迸嶂怯陆榻B,在此基礎上,他們又篩選出關(guān)鍵指標,最后實(shí)現僅憑借8個(gè)檢查指標就達到95%的預測準確率。
努力擁抱人工智能
其他領(lǐng)域的科研人員也在努力擁抱人工智能。
南京大學(xué)現代工程與應用科學(xué)學(xué)院教授李濤正嘗試將深度學(xué)習算法應用在超構光子技術(shù)領(lǐng)域。
“超構光子技術(shù)是通過(guò)每一個(gè)納米結構單元對光的調制來(lái)實(shí)現特定的光學(xué)功能?!崩顫榻B,以往在設計納米結構時(shí),需要人工設計一系列復雜的參數。
李濤現在嘗試,將已知的一套參數輸入到深度學(xué)習網(wǎng)絡(luò )中進(jìn)行訓練,使其學(xué)習參數的規律,然后不斷調試,最終通過(guò)深度學(xué)習網(wǎng)絡(luò )來(lái)設計更多的參數。
在李濤看來(lái),當前基于納米結構設計的超構材料光子學(xué)提供了調控光場(chǎng)的強大手段,它正逐漸從物理演示走向技術(shù)應用。而對于實(shí)用化的光學(xué)器件,需要滿(mǎn)足諸如工作效率、工作帶寬、成像分辨率、像差和色差等一系列性能參數要求,且不同使用場(chǎng)景對相關(guān)參數有不同要求。人工智能算法能大大提高設計效率,在多參數空間的優(yōu)化上具有巨大的優(yōu)勢。
“人工智能算法的引入將對超構光子技術(shù)發(fā)展,乃至變革光學(xué)技術(shù)的開(kāi)發(fā),如無(wú)標記超分辨成像、無(wú)透鏡成像等起到不可估量的推動(dòng)作用?!崩顫f(shuō)。
南京大學(xué)化學(xué)化工學(xué)院副教授李承輝前不久看到一篇科研論文,介紹如何用人工智能算法來(lái)推薦分子的合成路線(xiàn),這給了他不少啟發(fā)。他正在考慮如何用人工智能幫助他做化學(xué)研究。
李承輝告訴科技日報記者,他最近發(fā)現一種新的分子內成環(huán)反應,希望了解這種反應是否在其他分子內也存在?!耙獧z測這種化學(xué)反應是否具有普適性,需要用不同分子做大量實(shí)驗才行?!崩畛休x說(shuō),假如能利用人工智能縮小目標范圍,將大大減少他的工作量。
在知道精確結果的前提下,可以通過(guò)輸入關(guān)鍵字在化學(xué)數據庫去搜索相關(guān)分子。問(wèn)題在于,眼下并不知道精確結果。只知道滿(mǎn)足這種化學(xué)反應的大致條件,比如分子具有某種特殊的功能團等。因此李承輝期待將人工智能算法引入化學(xué)數據庫中:只告訴化學(xué)數據庫這種分子的大致特征,讓數據庫去智能搜索、篩選匹配的分子,縮小目標范圍。
幫助科學(xué)家在大數據中“采礦”
不過(guò),目前來(lái)看,像“阿爾法折疊”這樣針對特定科研領(lǐng)域的人工智能應用鳳毛麟角。普通科學(xué)家要想得心應手地用上人工智能這個(gè)工具,還是有一定門(mén)檻。
人工智能開(kāi)源算法,是李濤實(shí)現想法的途徑。他和學(xué)生已經(jīng)找到一種開(kāi)源算法,但這種算法對超構光子技術(shù)研究而言并非最優(yōu),因此需要不斷調試參數才行。
李承輝則打算找人工智能領(lǐng)域的專(zhuān)業(yè)人士聊一聊,學(xué)習一下怎么將人工智能算法應用到自己的研究當中。
裴智勇則幸運得多。他的研究領(lǐng)域是生物信息學(xué),是將計算機技術(shù)應用于生物學(xué)領(lǐng)域的交叉學(xué)科,因此裴智勇對人工智能算法的關(guān)注比較早。在具體應用中,開(kāi)源的人工智能算法如支持向量機(SVM)和隨機森林等為他提供了不少幫助。
“這些算法本身是開(kāi)源的,我們只需要根據自己的研究去修改其中的關(guān)鍵參數。也就是說(shuō),參數訓練是我們團隊自己來(lái)做?!迸嶂怯抡f(shuō)。
至于人工智能在科研領(lǐng)域的應用前景,不少人非??春?。
寒武紀公司總裁陳天石在接受科技日報記者采訪(fǎng)時(shí)說(shuō),人工智能的本質(zhì)是提供求解問(wèn)題的方法,比如在非常大的選擇空間當中做出最優(yōu)選擇。這是科學(xué)研究經(jīng)常會(huì )遇到的問(wèn)題,而人工智能恰恰可以幫助科研人員更快更好地解決此類(lèi)問(wèn)題。
“未來(lái)的人工智能可能會(huì )替代科學(xué)家的部分思考過(guò)程?!崩畛休x說(shuō),比如在化學(xué)領(lǐng)域,人工智能可以基于大數據幫助科研人員分析化學(xué)材料的性質(zhì)、特征,向科研人員提供多種合成路徑作為參考,并推薦低廉合成某種化合物的最優(yōu)路徑等等。
裴智勇的判斷是,人工智能算法在科研領(lǐng)域的應用會(huì )形成一個(gè)產(chǎn)業(yè)。以基因領(lǐng)域為例,未來(lái)的基因組數據積累和增長(cháng)速度越來(lái)越快,靠人工去處理、計算海量數據是遠遠不夠的。這就需要人工智能算法幫助科研人員在大數據中“采礦”,催生有價(jià)值的發(fā)現。
“人工智能技術(shù)迅速更新迭代,僅靠科研人員自己摸索開(kāi)源算法是不夠的?!迸嶂怯抡J為,今后可能會(huì )出現不同科研領(lǐng)域的團隊與人工智能領(lǐng)域的團隊合作,前者實(shí)現業(yè)務(wù)層工作,后者實(shí)現技術(shù)層工作。同時(shí),科研領(lǐng)域可能會(huì )涌現出更多“阿爾法折疊”這樣的人工智能應用。(記者劉園園)