人工智能,為科研注入智慧動能(科技自立自強)
本報記者 喻思南
核心閱讀
日前,科技部等六部門發(fā)文,著力打造若干重大場景,拓展人工智能應(yīng)用,高水平科研活動是其中之一。如今,我國人工智能技術(shù)快速發(fā)展,在數(shù)據(jù)獲取、實驗預(yù)測、結(jié)果分析等方面具有優(yōu)勢,生命科學(xué)、數(shù)學(xué)、化學(xué)、空間科學(xué)等學(xué)科研究紛紛擁抱人工智能。豐富的應(yīng)用場景也反哺技術(shù)發(fā)展,推動產(chǎn)業(yè)智慧升級。
從日常生活到科學(xué)研究,如今,我國人工智能技術(shù)快速發(fā)展,數(shù)據(jù)和算力資源日益豐富。應(yīng)用需求是技術(shù)進步的重要推動力,新技術(shù)往往在“用”中不斷完善、成熟。為推動人工智能落地,日前,科技部等六部門聯(lián)合印發(fā)了《關(guān)于加快場景創(chuàng)新以人工智能高水平應(yīng)用促進經(jīng)濟高質(zhì)量發(fā)展的指導(dǎo)意見》,著力打造若干重大場景,拓展人工智能應(yīng)用,高水平科研活動便是其中之一。
作為賦能手段,人工智能如何帶來新的研究方法,又如何為經(jīng)濟發(fā)展注入“智慧動能”?
融合緊密,助力科研更加高效、精準(zhǔn)
諸多學(xué)科中,生命科學(xué)研究與人工智能融合較為緊密,其中一個熱門方向是預(yù)測蛋白質(zhì)結(jié)構(gòu)。
蛋白質(zhì)具有三維結(jié)構(gòu),它的一級結(jié)構(gòu)(序列)由多個氨基酸串聯(lián)而成。三維結(jié)構(gòu)決定了蛋白質(zhì)在細胞中的功能,許多疾病都是因體內(nèi)重要的蛋白質(zhì)結(jié)構(gòu)異常而起。因此,繪制出人體內(nèi)重要蛋白質(zhì)的“三維地圖”,才能據(jù)此找到藥物作用于人體的靶點,從而研制出精準(zhǔn)有效的新藥。
傳統(tǒng)上,科學(xué)家利用冷凍電鏡、X射線、核磁共振等方法觀測蛋白質(zhì)三維結(jié)構(gòu),但這一過程耗時費力且花銷不菲。“以冷凍電鏡為例,布置一個觀測平臺耗資數(shù)千萬元,科研人員還要用很長時間才能繪制出蛋白質(zhì)結(jié)構(gòu)。”百度飛槳螺旋槳生物計算平臺負責(zé)人何徑舟表示。
由于難度高、實驗周期長、成本高,通過傳統(tǒng)方法觀測到的蛋白質(zhì)三維結(jié)構(gòu),至今數(shù)量非常有限。相比之下,氨基酸測序容易得多。為什么不能根據(jù)氨基酸序列來預(yù)測蛋白質(zhì)的結(jié)構(gòu)?早在1972年,美國生化學(xué)家克里斯蒂安·安芬森曾在諾貝爾獎的獲獎感言中提出這一設(shè)想。
從蛋白質(zhì)的一級結(jié)構(gòu)出發(fā)精準(zhǔn)預(yù)測其三維結(jié)構(gòu),正是人工智能所擅長的。然而,人類試圖解析蛋白質(zhì)組的工作進展緩慢。據(jù)解釋,這一方面因為現(xiàn)有的生物數(shù)據(jù)量小,質(zhì)量不高,深度學(xué)習(xí)缺乏足夠的樣本;另一方面因為人工智能算法成熟也需要過程。
近些年,隨著生物數(shù)據(jù)劇增以及人工智能技術(shù)的優(yōu)化,科學(xué)家建立起更精準(zhǔn)的預(yù)測模型。2020年12月,在一場比賽中,人工智能程序“阿爾法折疊”大放異彩,它預(yù)測的結(jié)果與大多數(shù)實驗數(shù)據(jù)差不多。這證明,預(yù)測蛋白質(zhì)結(jié)構(gòu),人工智能已經(jīng)相當(dāng)精準(zhǔn)。
如今,借助人工智能,曾經(jīng)可能耗時數(shù)年的工作,現(xiàn)在幾分鐘就能完成,還能解析傳統(tǒng)方法不能觀測到的一些蛋白質(zhì)結(jié)構(gòu)。
據(jù)了解,利用人工智能,科研人員預(yù)測出了約100萬個物種的超過2億種蛋白質(zhì)的結(jié)構(gòu),涵蓋科學(xué)界已編錄的幾乎每一種蛋白質(zhì)。這將對結(jié)構(gòu)生物學(xué)領(lǐng)域產(chǎn)生重大影響,可能引發(fā)生命科學(xué)研究的范式變革,并提升人類對生命的理解。
前景廣闊,在生命科學(xué)等多領(lǐng)域發(fā)揮作用
人工智能進入生命科學(xué)研究的視野,生物醫(yī)藥行業(yè)的需求是重要推動力。據(jù)介紹,在生物制藥行業(yè),每投入10億美元能夠研發(fā)出的藥物種類已不斷下降。新藥研發(fā)難度越來越大,周期越來越長,急需新方法突圍,人工智能被寄予厚望。
不只是加速新藥研發(fā),人工智能正在生命科學(xué)越來越多領(lǐng)域發(fā)揮重要作用。
今年初,國家超算成都中心運行的一個蛋白質(zhì)預(yù)測模型,幫助四川農(nóng)業(yè)大學(xué)農(nóng)學(xué)院小麥研究所團隊成功解析PGS1調(diào)控種子發(fā)育影響產(chǎn)量的分子機制,為培育高產(chǎn)高質(zhì)小麥材料提供理論依據(jù)。科研人員表示,如果沒有人工智能,很難高效做出這一突破性成果。
科研人員還嘗試將人工智能技術(shù)引入疫苗設(shè)計中。比如,相比于蛋白疫苗、DNA疫苗等,mRNA(信使核糖核酸)疫苗具有大規(guī)模生產(chǎn)快、抗感染性好等優(yōu)勢,但穩(wěn)定性和免疫原性相對較差。補上這些短板,科研人員一直希望通過優(yōu)化mRNA疫苗序列設(shè)計,使其更穩(wěn)定,免疫原性更強。更高效、成本更低,人工智能的介入有望為疫苗研發(fā)提供新思路。
精準(zhǔn)治療也是人工智能應(yīng)用的舞臺。通過機器學(xué)習(xí)的方法,理論上,人工智能可以解碼人體免疫系統(tǒng),更精準(zhǔn)地探尋到一些疾病的復(fù)雜免疫規(guī)律,從而幫助人們理解疾病,更高效率、更有針對性地開發(fā)治療藥物和方法。
隨著基因組學(xué)研究帶來的人體數(shù)據(jù)、新藥研發(fā)積累的知識增加,加上機器學(xué)習(xí)算法不斷迭代,業(yè)內(nèi)專家認為,在生命科學(xué)領(lǐng)域,人工智能前景廣闊。一些科研人員甚至設(shè)想依靠強大的生物計算引擎,利用大量的生物數(shù)據(jù),構(gòu)建統(tǒng)一的知識圖譜,以此推動對生命健康的認識。
場景豐富,推動應(yīng)用邁向更高水平
走進生命科學(xué)研究,人工智能在帶來新方法的同時,也有望開啟生物醫(yī)藥產(chǎn)業(yè)新時代。
業(yè)內(nèi)專家表示,抓住智能化藥物設(shè)計的新機遇,加強在人工智能+生物醫(yī)藥布局,有助于我們在新藥研發(fā)的新賽道上先行一步。
雖然人工智能+生物醫(yī)藥發(fā)展迅速,但總體上才剛剛起步。何徑舟認為,生物醫(yī)藥行業(yè)有數(shù)百年歷史,有成熟、完善的研究流程、產(chǎn)業(yè)鏈條和分工,人工智能改善的只是其中一些環(huán)節(jié),“生物醫(yī)藥事關(guān)生命健康,行業(yè)發(fā)展要穩(wěn)步推進,保持理性和敬畏!苯刂聊壳埃驔]有一款完全依靠人工智能發(fā)現(xiàn)的新藥。一些借助人工智能開發(fā)的產(chǎn)品,離真正的上市還有很長一段距離。
看到人工智能技術(shù)在數(shù)據(jù)獲取、實驗預(yù)測、結(jié)果分析等方面的優(yōu)勢,數(shù)學(xué)、化學(xué)、材料學(xué)和空間科學(xué)等學(xué)科也紛紛擁抱人工智能。
鋰電池性能因材料組成不同而有差異;貞(yīng)豐富多樣場景對鋰電池的需求,科研人員希望通過優(yōu)化材料組合,設(shè)計出合適的鋰電池體系。
“以前,設(shè)計材料體系主要靠人工實驗,效率非常低。”清華大學(xué)化學(xué)工程系教授張強說,眼下,他正帶領(lǐng)團隊用人工智能預(yù)測分子性質(zhì),從而更高效、精準(zhǔn)地找到能源材料,設(shè)計出更有價值、更安全的電池體系。
據(jù)測算,我國人工智能核心產(chǎn)業(yè)規(guī)模超過4000億元,企業(yè)數(shù)量超過3000家。得益于海量數(shù)據(jù)處理帶來的旺盛需求、豐富應(yīng)用場景提供的試驗土壤,我國在計算機視覺、語音識別等領(lǐng)域走在世界前列。
業(yè)內(nèi)專家建議,推動人工智能應(yīng)用邁向更高水平,有必要發(fā)揮我國應(yīng)用場景豐富的優(yōu)勢。圍繞高水平科研活動打造重大場景,將會推動我國人工智能應(yīng)用走深走實,為經(jīng)濟高質(zhì)量發(fā)展注入“智慧動能”。
《 人民日報 》( 2022年10月20日 14 版)