智東西(公眾號(hào):zhidxcom)
作者 | 汪越
編輯 | 心緣

智東西115日報(bào)道,昨天下午,2024科學(xué)智能峰會(huì)(AI for Science Forum)在北京大學(xué)百周年紀(jì)念講堂開幕!綜合論壇上,來自不同領(lǐng)域的頂尖科研專家們共同探討了AI技術(shù)在多個(gè)學(xué)科的應(yīng)用。從量子計(jì)算到生命科學(xué),再到材料研究與高性能計(jì)算,AI正在推動(dòng)各個(gè)領(lǐng)域的重大突破。

在物理學(xué)領(lǐng)域,中國科學(xué)院院士、復(fù)旦大學(xué)教授龔新高展示了AI優(yōu)化的量子計(jì)算算法如何提高粒子碰撞實(shí)驗(yàn)的精度,并在高維數(shù)據(jù)空間中實(shí)現(xiàn)精確模擬。

在生命科學(xué)領(lǐng)域,中國科學(xué)院院士、北京大學(xué)-清華大學(xué)生命科學(xué)聯(lián)合中心主任、北京大學(xué)定量生物學(xué)中心主任、北京大學(xué)前沿交叉學(xué)科研究院榮譽(yù)院長、國家自然科學(xué)基金委交叉科學(xué)部主任湯超強(qiáng)調(diào)AI在基因組數(shù)據(jù)實(shí)時(shí)解析中的潛力,AI算法能夠從龐大的遺傳數(shù)據(jù)中識(shí)別疾病早期跡象,顯著提高診斷和治療效率。

材料科學(xué)方面,中國科學(xué)院院士、北京大學(xué)黨委常委、副校長、深圳研究生院院長、博雅講席教授張錦介紹了深度學(xué)習(xí)與強(qiáng)化學(xué)習(xí)在新材料設(shè)計(jì)中的突破,尤其是AI加速新型催化劑的研發(fā),提升了材料性能預(yù)測和實(shí)驗(yàn)優(yōu)化的效率。

信息量爆棚的AI for Science盛會(huì)!多位院士集中開講,用AI破解材料難題、蛋白質(zhì)密碼

中國科學(xué)院院士、北京大學(xué)黨委常委、副校長、深圳研究生院院長、博雅講席教授張錦

在化學(xué)與材料的交叉學(xué)科中,中國科學(xué)技術(shù)大學(xué)講席教授江俊提出AI如何在高維數(shù)據(jù)與復(fù)雜系統(tǒng)之間架起橋梁,通過智能化的機(jī)器化學(xué)家角色,實(shí)現(xiàn)實(shí)驗(yàn)設(shè)計(jì)與優(yōu)化的大幅度提升。

北京科學(xué)智能研究院院長、深勢科技創(chuàng)始人兼首席科學(xué)家張林峰分享了AI4S在基礎(chǔ)設(shè)施建設(shè)中的應(yīng)用,AI通過大規(guī)模數(shù)據(jù)處理與推理助力科研,特別是在解決“維數(shù)災(zāi)難”與高維復(fù)雜問題上的突破。

華為計(jì)算系統(tǒng)優(yōu)化首席專家王龍?zhí)接懥薃I4S在高性能計(jì)算中的角色,展示了AI與傳統(tǒng)HPC架構(gòu)的結(jié)合如何提升科研效率,尤其是在海洋模擬與材料科學(xué)中的實(shí)際應(yīng)用。

一、龔新高院士:AI優(yōu)化原子勢開發(fā)與分子動(dòng)力學(xué)模擬,提升材料逆向設(shè)計(jì)效率

中國科學(xué)院院士、復(fù)旦大學(xué)教授龔新高在演講中談道,量子力學(xué)是物質(zhì)科學(xué)的基石,但由于其復(fù)雜性,僅在少數(shù)簡單體系中,如氫原子,才能獲得解析解答??茖W(xué)家們逐步將研究重心從理論物理轉(zhuǎn)向計(jì)算物理,試圖將這些解析上不可解的問題轉(zhuǎn)化為可計(jì)算和可模擬的形式。

這一轉(zhuǎn)變體現(xiàn)在科學(xué)研究的四個(gè)范式的演變中,每個(gè)階段都對(duì)物理學(xué)和材料科學(xué)的發(fā)展產(chǎn)生了深遠(yuǎn)影響。從依賴實(shí)驗(yàn)與經(jīng)驗(yàn)的經(jīng)驗(yàn)科學(xué),到涉及經(jīng)典物理學(xué)定律的理論科學(xué),再到通過密度泛函理論(DFT)和分子動(dòng)力學(xué)模擬的計(jì)算科學(xué),最終進(jìn)入數(shù)據(jù)挖掘、AI和機(jī)器學(xué)習(xí)結(jié)合的AI科學(xué)時(shí)代。這一轉(zhuǎn)變不僅改變了物理學(xué)的研究方式,也極大推動(dòng)了材料科學(xué)等多個(gè)領(lǐng)域的突破。

信息量爆棚的AI for Science盛會(huì)!多位院士集中開講,用AI破解材料難題、蛋白質(zhì)密碼

分子動(dòng)力學(xué)模擬被譽(yù)為探索復(fù)雜體系動(dòng)力學(xué)行為的“虛擬顯微鏡”,為深入理解材料和分子的行為提供了極其有力的工具。然而,當(dāng)前的挑戰(zhàn)在于如何準(zhǔn)確描述原子之間的相互作用勢。近年來,機(jī)器學(xué)習(xí)在原子勢開發(fā)中取得了顯著進(jìn)展,從2007年提出的局部描述符方法(BPNN)到2023年推出的通用勢能(M3GNet),研究者們不斷推動(dòng)對(duì)材料行為的理解。特別是自旋圖神經(jīng)網(wǎng)絡(luò)(SpinGNN)和深度勢能分子動(dòng)力學(xué)(DeePMD)的引入,為解決材料的復(fù)雜相互作用提供了全新的視角。

信息量爆棚的AI for Science盛會(huì)!多位院士集中開講,用AI破解材料難題、蛋白質(zhì)密碼

Kohn-Sham方程是密度泛函理論(DFT)中實(shí)現(xiàn)高效計(jì)算的核心工具。隨著AI技術(shù)的迅猛發(fā)展,機(jī)器學(xué)習(xí)模型逐漸被引入,用于改進(jìn)哈密頓量的求解方法。在銅材料建模中,研究者們提出了核嶺回歸(KRR)和高斯過程回歸(GPR)等方法,并將這些方法擴(kuò)展到分子系統(tǒng)和石墨烯等材料的研究。2023年推出的HamGNN模型展示了其在處理二氧化硅及其不同同分異構(gòu)體方面的出色能力,極大地提升了計(jì)算效率和預(yù)測精度。

信息量爆棚的AI for Science盛會(huì)!多位院士集中開講,用AI破解材料難題、蛋白質(zhì)密碼

電子激發(fā)態(tài)載流子動(dòng)力學(xué)模擬在光物理和光化學(xué)領(lǐng)域具有重要意義。然而,傳統(tǒng)方法面臨著諸多挑戰(zhàn),包括電子運(yùn)動(dòng)的時(shí)間尺度遠(yuǎn)快于原子運(yùn)動(dòng)、激發(fā)態(tài)勢能面振蕩劇烈以及長時(shí)間模擬的精度不足。N2AMD(神經(jīng)網(wǎng)絡(luò)非絕熱分子動(dòng)力學(xué))模型的提出,結(jié)合了神經(jīng)網(wǎng)絡(luò)和哈密頓量的優(yōu)勢,成功實(shí)現(xiàn)了對(duì)數(shù)萬原子規(guī)模的雜化泛函動(dòng)力學(xué)模擬。該模型不僅在計(jì)算精度上達(dá)到了1%的誤差,且相比傳統(tǒng)的DFT方法提高了四個(gè)數(shù)量級(jí)的計(jì)算效率,為材料逆向設(shè)計(jì)開辟了全新的領(lǐng)域。

信息量爆棚的AI for Science盛會(huì)!多位院士集中開講,用AI破解材料難題、蛋白質(zhì)密碼

AI物理為材料設(shè)計(jì)提供了高效的新途徑,利用機(jī)器學(xué)習(xí)技術(shù)大幅提升了逆向材料設(shè)計(jì)的效率?;贏I的電子結(jié)構(gòu)庫和在線預(yù)測平臺(tái),如“AI物質(zhì)科學(xué)實(shí)驗(yàn)室”,為材料檢索和結(jié)構(gòu)預(yù)測提供了強(qiáng)大的支持。這些平臺(tái)不僅綜合性強(qiáng)、開放性好,還擁有龐大的電子結(jié)構(gòu)數(shù)據(jù)庫,能夠支持快速預(yù)測超過20萬個(gè)晶體的電子結(jié)構(gòu)。

未來,AI與物理學(xué)的結(jié)合將繼續(xù)推動(dòng)材料設(shè)計(jì)的高效性和精準(zhǔn)性,助力納米材料、量子材料等領(lǐng)域的創(chuàng)新。

二、湯超院士:提出“AI+生命科學(xué)”整體框架,呼吁共享數(shù)據(jù)資源

中國科學(xué)院院士、北京大學(xué)-清華大學(xué)生命科學(xué)聯(lián)合中心主任、北京大學(xué)定量生物學(xué)中心主任、北京大學(xué)前沿交叉學(xué)科研究院榮譽(yù)院長、國家自然科學(xué)基金委交叉科學(xué)部主任湯超在其演講中分享說,AI與生命科學(xué)的交匯正迅速演變成一種新的研究范式,稱為“AI for Science”。

這一轉(zhuǎn)變在2024年諾貝爾獎(jiǎng)的授予中得到體現(xiàn)。約翰·霍普菲爾德和杰弗里·E·辛頓因在機(jī)器學(xué)習(xí)領(lǐng)域的基礎(chǔ)性發(fā)現(xiàn)獲得諾貝爾物理學(xué)獎(jiǎng),戴維·貝克、德米斯·哈薩比斯和約翰·江珀因通過人工神經(jīng)網(wǎng)絡(luò)提出的蛋白質(zhì)結(jié)構(gòu)預(yù)測模型獲得諾貝爾化學(xué)獎(jiǎng)。

信息量爆棚的AI for Science盛會(huì)!多位院士集中開講,用AI破解材料難題、蛋白質(zhì)密碼

隨著生命科學(xué)大模型的發(fā)展,科學(xué)研究的視野已從單純的分子層面拓展至細(xì)胞和組織層級(jí)。2014年注意力機(jī)制的提出、2018年AlphaFold的發(fā)布以及2020年蛋白質(zhì)語言模型ESM-1b的推出,為這一進(jìn)展奠定了基礎(chǔ)。2023年,AlphaFold 2和ESM-2等模型在蛋白質(zhì)結(jié)構(gòu)預(yù)測方面取得顯著進(jìn)展,展示了AI在處理復(fù)雜生物數(shù)據(jù)方面的強(qiáng)大能力。

信息量爆棚的AI for Science盛會(huì)!多位院士集中開講,用AI破解材料難題、蛋白質(zhì)密碼

在生物科學(xué)中,數(shù)據(jù)的規(guī)模和精確度仍然是一個(gè)稀缺資源。生命本身是一個(gè)多層次、多維度的復(fù)雜系統(tǒng),每個(gè)層次都有其特定的語言和邏輯,并且相互影響,這對(duì)AI的應(yīng)用提出了更高的要求。

傳統(tǒng)的AI框架擅長處理結(jié)構(gòu)化和線性數(shù)據(jù),但在面對(duì)生命科學(xué)中高維非線性數(shù)據(jù)的復(fù)雜性時(shí),傳統(tǒng)方法顯得力不從心。如何有效整合多模態(tài)和多層次的數(shù)據(jù),是生命科學(xué)AI研究的關(guān)鍵挑戰(zhàn)。

與歐美國家相比,我國生命科學(xué)領(lǐng)域的數(shù)據(jù)利用率仍然較低。例如,英國生物庫Biobank自2006年成立以來,已追蹤了50萬名個(gè)體的健康數(shù)據(jù)。近期,Biobank獲得了近5000萬英鎊的資金支持,以加強(qiáng)數(shù)據(jù)存儲(chǔ)、AI和機(jī)器學(xué)習(xí)等方向,并實(shí)現(xiàn)數(shù)據(jù)全球共享。

信息量爆棚的AI for Science盛會(huì)!多位院士集中開講,用AI破解材料難題、蛋白質(zhì)密碼

為解決這些挑戰(zhàn),湯超提出了“AI與生命科學(xué)”的整體框架,涵蓋了四個(gè)關(guān)鍵組成部分:AI模型的底層框架、生物數(shù)據(jù)資源體系、多模態(tài)和多層次數(shù)據(jù)的整合以及復(fù)雜系統(tǒng)理論的融入。這個(gè)框架旨在提升實(shí)驗(yàn)建模能力,通過構(gòu)建大型多模態(tài)生物數(shù)據(jù)庫,實(shí)現(xiàn)數(shù)據(jù)共享,并搭建高通量數(shù)據(jù)生產(chǎn)的公共平臺(tái)。

信息量爆棚的AI for Science盛會(huì)!多位院士集中開講,用AI破解材料難題、蛋白質(zhì)密碼

湯超稱,未來的研究將致力于創(chuàng)新多模態(tài)大模型的底層框架,優(yōu)化針對(duì)不同數(shù)據(jù)類型的編碼器設(shè)計(jì),并構(gòu)建全新的模型架構(gòu),以捕捉生命現(xiàn)象中的語言邏輯、自組織特性、涌現(xiàn)現(xiàn)象、反饋機(jī)制以及適應(yīng)性等特征。

湯超說道,他的目標(biāo)是希望能構(gòu)建一個(gè)多模態(tài)、跨層次的生命科學(xué)大模型,深入揭示這一復(fù)雜領(lǐng)域中的新規(guī)律和新原理。通過這一框架的建設(shè),AI與生命科學(xué)的融合將極大推動(dòng)人們對(duì)生命復(fù)雜性的理解,對(duì)生命機(jī)制和運(yùn)作原理的洞察。

信息量爆棚的AI for Science盛會(huì)!多位院士集中開講,用AI破解材料難題、蛋白質(zhì)密碼

三、張錦院士:AI與材料科學(xué)互相助攻,輔助研發(fā)將向AI Agent進(jìn)化

在材料科學(xué)領(lǐng)域,AI的應(yīng)用正逐漸改變傳統(tǒng)的研究模式。中國科學(xué)院院士、北京大學(xué)黨委常委、副校長、深圳研究生院院長、博雅講席教授張錦在演講中談道,材料研發(fā)面臨的根本問題是如何處理數(shù)據(jù)的復(fù)雜性。傳統(tǒng)材料科學(xué)因數(shù)據(jù)采集標(biāo)準(zhǔn)不一,導(dǎo)致實(shí)驗(yàn)結(jié)果差異較大。張錦強(qiáng)調(diào),數(shù)據(jù)標(biāo)準(zhǔn)化是實(shí)現(xiàn)數(shù)據(jù)共享、再現(xiàn)性和科學(xué)知識(shí)迭代的基礎(chǔ)。

在研究思維方面,傳統(tǒng)科學(xué)方法傾向于追求簡潔的公式和規(guī)律,以解釋復(fù)雜現(xiàn)象。然而,材料科學(xué)往往缺乏簡單的因果關(guān)系,盲目歸因可能導(dǎo)致失真,喪失對(duì)整體系統(tǒng)的全面理解。張錦說,這種局限性意味著材料科學(xué)亟需新的研究范式。

信息量爆棚的AI for Science盛會(huì)!多位院士集中開講,用AI破解材料難題、蛋白質(zhì)密碼

AI正為材料科學(xué)提供突破性解決方案。AI擅長處理高維度、多尺度的數(shù)據(jù),發(fā)現(xiàn)復(fù)雜的非線性關(guān)系,這在傳統(tǒng)方法中是難以實(shí)現(xiàn)的。例如,DeepMind在2022年通過AI控制核聚變等離子體形狀,GraphCast在2023年超越了最先進(jìn)的人類天氣預(yù)測系統(tǒng)。2024年,AlphaFold 3預(yù)測了所有生命分子的結(jié)構(gòu)和相互作用,為生物科學(xué)帶來重大進(jìn)展。

張錦說,AI正從物理工具拓展到心智延伸。AI不僅輔助科學(xué)家處理海量信息,還支持從直覺驅(qū)動(dòng)轉(zhuǎn)向數(shù)據(jù)驅(qū)動(dòng)的決策,通過輔助創(chuàng)作和創(chuàng)新,放大人類的創(chuàng)造力。

最后,張錦展望了“Materials for AI”的未來。AI硬件的突破將依賴于材料科學(xué)的推動(dòng),碳基半導(dǎo)體的進(jìn)展有望延續(xù)摩爾定律,光子晶體器件將大幅提升計(jì)算速率?!癆I for Materials”與“Materials for AI”的雙向互動(dòng)關(guān)系將成為未來科技創(chuàng)新的推動(dòng)力。

正如2024年諾貝爾物理學(xué)獎(jiǎng)和化學(xué)獎(jiǎng)的授予所示,人工神經(jīng)網(wǎng)絡(luò)和蛋白質(zhì)結(jié)構(gòu)預(yù)測的突破表明,科學(xué)研究將不再單純追求傳統(tǒng)的可解釋性,而是更多地依賴于黑箱式的預(yù)測模型。實(shí)驗(yàn)驗(yàn)證和不斷校準(zhǔn)將成為獲取精準(zhǔn)理解的重要途徑。

信息量爆棚的AI for Science盛會(huì)!多位院士集中開講,用AI破解材料難題、蛋白質(zhì)密碼

四、中科大江俊:大模型與機(jī)器人融合,打造機(jī)器化學(xué)家

中國科學(xué)技術(shù)大學(xué)講席教授江俊在演講中談道,化學(xué)演化研究中,理想模型與實(shí)際體系之間的脫節(jié)是科學(xué)家面臨的一大難題。理論研究通常基于低維度的數(shù)學(xué)規(guī)則,如量子力學(xué)和元素周期表等基本物理定律,而實(shí)際應(yīng)用場景則是高度復(fù)雜的高維問題,涉及化學(xué)、材料、能源、生命科學(xué)和醫(yī)藥等多個(gè)領(lǐng)域。

信息量爆棚的AI for Science盛會(huì)!多位院士集中開講,用AI破解材料難題、蛋白質(zhì)密碼

針對(duì)這一挑戰(zhàn),AI正提供全新的解決方案。通過機(jī)器學(xué)習(xí)與深度學(xué)習(xí)技術(shù),AI能夠在大量科學(xué)數(shù)據(jù)的基礎(chǔ)上進(jìn)行自我學(xué)習(xí)和優(yōu)化,將理論與實(shí)踐更好地結(jié)合。

在材料科學(xué)和催化劑設(shè)計(jì)方面,例如,在“高熵非貴金屬產(chǎn)氧催化劑”項(xiàng)目中,研究人員通過207次機(jī)器實(shí)驗(yàn)和25426次理論模擬,篩選出553401種候選組合,最終找到最優(yōu)的催化劑配方,將傳統(tǒng)方法需要1400年的試錯(cuò)時(shí)間縮短至5周。

在材料設(shè)計(jì)方面,例如,在火星產(chǎn)氧催化劑的創(chuàng)制中,科學(xué)家利用AI和機(jī)器人技術(shù),結(jié)合LIBS光譜技術(shù)賦予機(jī)器人元素分析能力,僅用2個(gè)月時(shí)間完成了原本需要數(shù)千年的百萬級(jí)隕石配方篩選任務(wù),并成功創(chuàng)制出高效的產(chǎn)氧催化劑,為火星任務(wù)提供了技術(shù)支持。

隨著科技的發(fā)展,科研方式正在深刻變化。從傳統(tǒng)的“能讀-會(huì)算-勤做”到如今的大模型驅(qū)動(dòng)的科研智能體,科學(xué)家們的工作模式正向智能化、自動(dòng)化轉(zhuǎn)型。機(jī)器化學(xué)家作為新興角色,依靠AI進(jìn)行實(shí)驗(yàn)設(shè)計(jì)、數(shù)據(jù)分析和優(yōu)化。

信息量爆棚的AI for Science盛會(huì)!多位院士集中開講,用AI破解材料難題、蛋白質(zhì)密碼

例如,機(jī)器化學(xué)家通過智能體分析實(shí)驗(yàn)數(shù)據(jù),結(jié)合貝葉斯優(yōu)化算法,提出新的實(shí)驗(yàn)建議。在金屬催化劑研究中,AI分析不同金屬成分與催化反應(yīng)速率的關(guān)系,建議降低鐵的含量,增加釩的含量,從而提高催化效率。

AI驅(qū)動(dòng)的強(qiáng)化學(xué)習(xí)也在理論預(yù)訓(xùn)練與機(jī)器實(shí)驗(yàn)的結(jié)合中取得進(jìn)展。通過機(jī)器學(xué)習(xí)算法與實(shí)驗(yàn)數(shù)據(jù)的互動(dòng),AI不斷改進(jìn)模型,推動(dòng)理論與實(shí)踐的深度融合。例如,理論預(yù)測與GPT增強(qiáng)的貝葉斯優(yōu)化相結(jié)合,使科學(xué)家能夠更高效地發(fā)現(xiàn)高性能的納米酶,將傳統(tǒng)反復(fù)實(shí)驗(yàn)轉(zhuǎn)變?yōu)楦咝У睦碚擃A(yù)訓(xùn)練和智能實(shí)驗(yàn)結(jié)合的新階段。

AI在科學(xué)研究中的應(yīng)用正得到全球范圍內(nèi)的大力支持。2023年,美國投資1610萬美元建設(shè)AI共享研究基礎(chǔ)設(shè)施;瑞士投資1億人民幣打造開放式科研設(shè)施;荷蘭投資7.6億人民幣發(fā)展機(jī)器人化學(xué)實(shí)驗(yàn)室生態(tài)系統(tǒng)。

信息量爆棚的AI for Science盛會(huì)!多位院士集中開講,用AI破解材料難題、蛋白質(zhì)密碼

未來,AI與機(jī)器人的結(jié)合將進(jìn)一步推動(dòng)科研創(chuàng)新。通過大規(guī)模智能科研基礎(chǔ)設(shè)施,科學(xué)家能夠按需創(chuàng)制材料和設(shè)計(jì)化學(xué)品,解決當(dāng)前技術(shù)難以克服的復(fù)雜問題。例如,機(jī)器化學(xué)家云科學(xué)裝置作為一個(gè)科研平臺(tái),實(shí)現(xiàn)人機(jī)協(xié)同工作,推動(dòng)化學(xué)與材料科學(xué)的按需創(chuàng)制。通過智能推薦、實(shí)驗(yàn)方案優(yōu)化和數(shù)據(jù)預(yù)測,科學(xué)家將能夠?qū)崿F(xiàn)更加高效和精準(zhǔn)的科研目標(biāo)。

AI技術(shù)通過理論與實(shí)踐的深度融合,解決了從大數(shù)據(jù)到小數(shù)據(jù)的轉(zhuǎn)換問題,推動(dòng)了化學(xué)、材料等領(lǐng)域的科研進(jìn)步。

信息量爆棚的AI for Science盛會(huì)!多位院士集中開講,用AI破解材料難題、蛋白質(zhì)密碼

五、深勢科技張林峰:克服維數(shù)災(zāi)難,AI4S實(shí)現(xiàn)從想法到成果落地

北京科學(xué)智能研究院院長、深勢科技創(chuàng)始人兼首席科學(xué)家張林峰在演講中深入探討了AI4S(AI for Science)如何通過機(jī)器學(xué)習(xí)、數(shù)據(jù)推理等先進(jìn)手段,助力科研人員高效分析和處理海量數(shù)據(jù),從而推動(dòng)從基礎(chǔ)理論研究到應(yīng)用實(shí)踐。

張林峰說,AI4S的早期突破主要體現(xiàn)在對(duì)高維數(shù)據(jù)的有效處理上。他強(qiáng)調(diào),AI技術(shù)能夠幫助科研人員克服“維數(shù)災(zāi)難”的挑戰(zhàn)。在圖像識(shí)別、人臉生成、AlphaGo等經(jīng)典應(yīng)用場景中,AI通過深度神經(jīng)網(wǎng)絡(luò)模型,成功逼近了高維函數(shù)或概率分布,為科學(xué)研究提供了全新的視角和解決方案。

信息量爆棚的AI for Science盛會(huì)!多位院士集中開講,用AI破解材料難題、蛋白質(zhì)密碼

AI4S的實(shí)現(xiàn)依賴于兩大核心驅(qū)動(dòng)力:數(shù)據(jù)驅(qū)動(dòng)與基本原理驅(qū)動(dòng)。通過AI4S,科學(xué)家們不僅能夠通過海量數(shù)據(jù)揭示規(guī)律,還能夠利用物理和化學(xué)的基本原理指導(dǎo)新技術(shù)的研發(fā)。例如,2020年獲得“Gordon Bell”獎(jiǎng)的深度勢能分子動(dòng)力學(xué)研究,成功破解了分子模擬中的高維復(fù)雜問題,推動(dòng)了物質(zhì)科學(xué)的進(jìn)步。此外,DeepMind的AlphaFold2在破解蛋白質(zhì)結(jié)構(gòu)預(yù)測難題上也取得了突破,展示了AI在基礎(chǔ)科學(xué)前沿的潛力。

在建設(shè)AI4S基礎(chǔ)設(shè)施的過程中,科研人員面臨著從基礎(chǔ)要素到行業(yè)解決方案的“多級(jí)跳”。模型、算力、數(shù)據(jù)和工作流的協(xié)同發(fā)展至關(guān)重要。

信息量爆棚的AI for Science盛會(huì)!多位院士集中開講,用AI破解材料難題、蛋白質(zhì)密碼

在AI4S的發(fā)展路徑中,重構(gòu)大規(guī)模生物數(shù)據(jù)的標(biāo)注解析流程成為一個(gè)重要應(yīng)用方向。通過AI4S,科學(xué)家能夠在海量多模態(tài)生物信息中挖掘新的規(guī)律和結(jié)構(gòu)。以Uni-RNA為例,AI4S可以將復(fù)雜的生物數(shù)據(jù)轉(zhuǎn)化為有意義的圖譜,幫助研究者更精準(zhǔn)地理解生物機(jī)制,發(fā)現(xiàn)疾病演化的軌跡。

在物質(zhì)科學(xué)領(lǐng)域,AI4S通過分子層面的模擬和預(yù)測,加速了新型催化劑和藥物的設(shè)計(jì)。例如,在設(shè)計(jì)高效的產(chǎn)氧催化劑時(shí),AI4S通過機(jī)器實(shí)驗(yàn)和智能模型的迭代優(yōu)化,大大縮短了研發(fā)周期,提高了材料設(shè)計(jì)的效率。

AI4S的最終目標(biāo)是構(gòu)建一個(gè)完備的科研生態(tài)系統(tǒng),通過智能化、自動(dòng)化的工具,幫助科學(xué)家高效地實(shí)現(xiàn)從想法到成果的全過程。這一系統(tǒng)將涵蓋數(shù)據(jù)采集、實(shí)驗(yàn)設(shè)計(jì)、模型訓(xùn)練、結(jié)果分析等環(huán)節(jié),形成一個(gè)無縫銜接的科研工作流,全面賦能物質(zhì)和生命科學(xué)的大發(fā)現(xiàn)。

信息量爆棚的AI for Science盛會(huì)!多位院士集中開講,用AI破解材料難題、蛋白質(zhì)密碼

六、華為首席王龍:AI4S開發(fā)架構(gòu)經(jīng)歷革新,用戶將能夠?qū)W⒂谒惴ㄑ芯?/strong>

華為計(jì)算系統(tǒng)優(yōu)化首席專家王龍?jiān)谘葜v中深入探討了AI4S在計(jì)算科學(xué)中的應(yīng)用實(shí)踐及軟件基礎(chǔ)設(shè)施的探索。他談道,在當(dāng)前科學(xué)計(jì)算領(lǐng)域飛速發(fā)展的背景下,AI正與傳統(tǒng)的高性能計(jì)算(HPC)緊密結(jié)合,不斷突破計(jì)算能力的極限。

王龍預(yù)測,在接下來的5到10年里,AI4S將在地球科學(xué)、材料科學(xué)、生命科學(xué)等多個(gè)領(lǐng)域迅速發(fā)展,其在高性能計(jì)算應(yīng)用中的比重也將不斷增加。AI4S被視為HPC的“下一步”,即將成為科學(xué)計(jì)算的新標(biāo)準(zhǔn)。其核心優(yōu)勢在于能夠高效處理大規(guī)模數(shù)據(jù)并進(jìn)行智能推理,這對(duì)于科學(xué)計(jì)算中的數(shù)據(jù)分析、模擬和預(yù)測具有重要意義。

信息量爆棚的AI for Science盛會(huì)!多位院士集中開講,用AI破解材料難題、蛋白質(zhì)密碼

他還談道,隨著國產(chǎn)處理器的興起,AI4S的開發(fā)架構(gòu)正經(jīng)歷一場革新。當(dāng)前計(jì)算架構(gòu)面臨的一些主要挑戰(zhàn)包括批量優(yōu)化難以達(dá)到最佳狀態(tài)、個(gè)性化優(yōu)化的復(fù)雜性日益增加,以及單一應(yīng)用需要多份代碼的現(xiàn)象,都增加了開發(fā)難度。為了解決這些問題,未來的AI4S開發(fā)架構(gòu)將更加側(cè)重于自動(dòng)優(yōu)化,減少手動(dòng)優(yōu)化的需求,從而大幅提高開發(fā)效率。

王龍進(jìn)一步說,AI4S的理想發(fā)展方向是讓用戶能夠?qū)W⒂谒惴ㄑ芯?,而不必過多涉及硬件優(yōu)化。通過自動(dòng)化系統(tǒng)完成所有的優(yōu)化過程,算法開發(fā)者可以將更多精力投入到創(chuàng)新和算法本身的提升上,而不是花費(fèi)大量時(shí)間在硬件和架構(gòu)的調(diào)整上。

AI4S在實(shí)際應(yīng)用中的一個(gè)典型例子是MASNUM(Marine Science and Numerical Modeling),這是一種由自然資源部第一海洋研究所自主研發(fā)的海浪數(shù)值模式,用于海洋計(jì)算模擬。作為全球領(lǐng)先的海浪模式之一,MASNUM在海洋波動(dòng)的模擬與預(yù)報(bào)方面具有重要意義,曾入圍2016年戈登貝爾獎(jiǎng)。隨著超算和觀測技術(shù)的發(fā)展,海洋模擬正逐漸向精細(xì)化方向發(fā)展。

海浪模擬依然存在準(zhǔn)確性與計(jì)算成本之間的矛盾:提高模擬精度需要增加計(jì)算量,這會(huì)導(dǎo)致運(yùn)行成本上升。引入AI4S后,通過智能算法對(duì)低分辨率模式的數(shù)據(jù)進(jìn)行降尺度處理,實(shí)現(xiàn)了高分辨率模擬,同時(shí)保持較低的計(jì)算成本。

AI4S加速HPC應(yīng)用的關(guān)鍵方案是“1+1”模式,即將傳統(tǒng)HPC架構(gòu)與AI框架(如PyTorch、TensorFlow)結(jié)合優(yōu)化。在這種模式下,用戶可以在不改變現(xiàn)有開發(fā)環(huán)境和編程習(xí)慣的情況下,繼續(xù)使用Fortran或C/C++進(jìn)行高效源碼開發(fā),同時(shí)利用Python進(jìn)行AI模型訓(xùn)練。AI4S的核心優(yōu)勢在于其能夠無縫后端優(yōu)化,即用戶繼續(xù)使用熟悉的工具和語言,而平臺(tái)自動(dòng)嵌入推理引擎并優(yōu)化性能。這種方式不僅簡化了開發(fā)流程,還提升了計(jì)算效率,使得計(jì)算任務(wù)可以更加高效地運(yùn)行。

在軟件基礎(chǔ)設(shè)施層面,華為提出了神筆馬良概念,這是一種自動(dòng)化性能優(yōu)化技術(shù),能夠在不改變用戶原始代碼的情況下自動(dòng)接管性能優(yōu)化工作。通過神筆馬良,用戶無需深入了解硬件細(xì)節(jié)或編寫復(fù)雜的優(yōu)化代碼,所有優(yōu)化過程均由系統(tǒng)自動(dòng)完成,從而大大降低了開發(fā)成本和時(shí)間,同時(shí)提升了計(jì)算性能。

在具體應(yīng)用中,神筆馬良對(duì)MASNUM的加速效果顯著。例如,在鯤鵬計(jì)算系統(tǒng)上,神筆馬良能夠?qū)庀蟆⒑Q?、材料科學(xué)等領(lǐng)域的計(jì)算任務(wù)加速數(shù)倍,具體表現(xiàn)為E2E性能提升比率的顯著增加。

通過多層算子優(yōu)化和圖優(yōu)化技術(shù),神筆馬良在不改變代碼的情況下成功提升了MASNUM模型的性能,最終實(shí)現(xiàn)了8.2倍的E2E加速效果。

在HPC應(yīng)用中,AI4S不僅能幫助科研人員加速計(jì)算過程,還能通過自動(dòng)化性能優(yōu)化、智能代碼生成等技術(shù),降低開發(fā)的復(fù)雜度,推動(dòng)領(lǐng)域創(chuàng)新。未來,隨著AI4S算法的不斷進(jìn)步和自動(dòng)化性能優(yōu)化技術(shù)的發(fā)展,計(jì)算科學(xué)將邁入新時(shí)代,科研人員將更加專注于算法創(chuàng)新,不再受制于繁雜的硬件優(yōu)化問題。

七、圓桌對(duì)話:AI4S將成為科學(xué)計(jì)算的新標(biāo)準(zhǔn),計(jì)算科學(xué)軟件有望全面重構(gòu)

圓桌對(duì)話由中國科學(xué)院院士、北京科學(xué)智能研究院院長、北京大學(xué)國際機(jī)器學(xué)習(xí)研究中心主任鄂維南主持,邀請了中國科學(xué)院院士、復(fù)旦大學(xué)教授龔新高,中國科學(xué)技術(shù)大學(xué)講席教授江俊,北京科學(xué)智能研究院院長、深勢科技創(chuàng)始人兼首席科學(xué)家張林峰,華為計(jì)算系統(tǒng)優(yōu)化首席專家王龍,北京大學(xué)博雅特聘教授、博士生導(dǎo)師、IEEE Fellow、北京大學(xué)深圳研究生院信息工程學(xué)院院長田永鴻參與。圓桌會(huì)議圍繞數(shù)據(jù)重塑、AI與基礎(chǔ)科學(xué)的結(jié)合、人才培養(yǎng)、F30項(xiàng)目愿景以及面臨的挑戰(zhàn)等議題展開了深入討論。

信息量爆棚的AI for Science盛會(huì)!多位院士集中開講,用AI破解材料難題、蛋白質(zhì)密碼

從左至右:中國科學(xué)院院士、北京科學(xué)智能研究院院長、北京大學(xué)國際機(jī)器學(xué)習(xí)研究中心主任鄂維南,中國科學(xué)院院士、復(fù)旦大學(xué)教授龔新高,北京科學(xué)智能研究院院長、深勢科技創(chuàng)始人兼首席科學(xué)家張林峰,華為計(jì)算系統(tǒng)優(yōu)化首席專家王龍,中國科學(xué)技術(shù)大學(xué)講席教授江俊,北京大學(xué)博雅特聘教授、博士生導(dǎo)師、IEEE Fellow、北京大學(xué)深圳研究生院信息工程學(xué)院院長田永鴻。

多位嘉賓強(qiáng)調(diào)了數(shù)據(jù)重塑在科學(xué)研究中的核心作用。江俊談道,當(dāng)前最為緊迫的任務(wù)便是解決數(shù)據(jù)重塑問題。由于實(shí)驗(yàn)條件和環(huán)境的差異,現(xiàn)有的許多實(shí)驗(yàn)數(shù)據(jù)難以達(dá)到統(tǒng)一標(biāo)準(zhǔn),這不僅影響了研究結(jié)果的可靠性,也限制了不同研究成果之間的可比較性。

與會(huì)嘉賓一致認(rèn)為,建立一個(gè)標(biāo)準(zhǔn)化的數(shù)據(jù)生產(chǎn)與重塑平臺(tái)至關(guān)重要。這樣的平臺(tái)不僅能顯著提升數(shù)據(jù)的質(zhì)量,還將極大促進(jìn)不同研究團(tuán)隊(duì)間的數(shù)據(jù)共享與合作。

F30項(xiàng)目成為本次會(huì)議重點(diǎn)討論的內(nèi)容之一。此項(xiàng)目由北京大學(xué)與北京科學(xué)智能研究院聯(lián)合發(fā)起,旨在運(yùn)用AI技術(shù)解決科學(xué)領(lǐng)域內(nèi)的重大挑戰(zhàn)。與會(huì)嘉賓普遍認(rèn)為,F(xiàn)30項(xiàng)目有望在未來5至10年間取得突破性成果,特別是在材料科學(xué)和生物醫(yī)藥等關(guān)鍵領(lǐng)域。張林峰說,通過開發(fā)標(biāo)準(zhǔn)化接口和優(yōu)化工作流,促進(jìn)數(shù)據(jù)、模型與應(yīng)用之間的良性循環(huán),可大幅提高科研工作的效率,讓科學(xué)家們能更專注于解決核心科學(xué)問題。

雖然應(yīng)用前景廣闊,但AI for Science仍然面臨著多重挑戰(zhàn)。

首要問題是數(shù)據(jù)獲取難題,高質(zhì)量的數(shù)據(jù)對(duì)于AI模型的訓(xùn)練至關(guān)重要,然而目前許多科研團(tuán)隊(duì)面臨著數(shù)據(jù)不足的困境;其次是計(jì)算資源的限制,HPC作為AI研究的基石,其高昂的成本和較高的使用門檻成為了眾多研究人員前進(jìn)道路上的障礙;此外,人才短缺也是制約AI for Science發(fā)展的一大瓶頸。

王龍還談道,AI技術(shù)的應(yīng)用不應(yīng)過于泛化,而應(yīng)針對(duì)不同領(lǐng)域的特定需求進(jìn)行精細(xì)化調(diào)整,以克服碎片化和泛化性的問題。

最后,與會(huì)嘉賓對(duì)2至3年內(nèi)可能取得的突破進(jìn)行了展望。

龔新高稱,在接下來的2至3年內(nèi),計(jì)算科學(xué)的軟件有望實(shí)現(xiàn)全面重構(gòu),這將為“AI for Science”的發(fā)展提供強(qiáng)有力的技術(shù)支持。

張林峰說,隨著AI技術(shù)從初步嘗試到快速迭代(如AlphaGo從1到2版本的升級(jí),以及GPT從1到4版本的演進(jìn)),AI正加速化學(xué)領(lǐng)域的進(jìn)步,促進(jìn)新化學(xué)規(guī)律的發(fā)現(xiàn)及新物質(zhì)的合成。

王龍聚焦于DPA-2及其在氣象領(lǐng)域的應(yīng)用,認(rèn)為AI技術(shù)將在提升氣象預(yù)報(bào)準(zhǔn)確性和數(shù)據(jù)處理能力方面發(fā)揮關(guān)鍵作用。

江俊關(guān)注的是基礎(chǔ)科學(xué)中的鐠學(xué)與光譜分析,特別是如何利用AI技術(shù)改進(jìn)一維曲線和二維圖像的解析,以加速新材料和新物質(zhì)的發(fā)現(xiàn)。

田永鴻特別談道AI在制藥行業(yè)的潛力,認(rèn)為AI驅(qū)動(dòng)的方法將在藥物研發(fā)流程中占據(jù)核心地位,不僅能夠加速新藥的發(fā)現(xiàn),還能促進(jìn)其更快地進(jìn)入市場。

結(jié)語:從量子計(jì)算到生命科學(xué)的跨學(xué)科滲透

從量子計(jì)算到生命科學(xué),再到材料研究與化學(xué)創(chuàng)新,AI的多領(lǐng)域滲透正在加速推動(dòng)科學(xué)邊界的突破。與會(huì)的專家們不僅分享了各自領(lǐng)域中的技術(shù)進(jìn)展,也深刻探討了跨學(xué)科協(xié)作的重要性,尤其是在數(shù)據(jù)隱私、模型可解釋性和算法公平性等挑戰(zhàn)面前,如何構(gòu)建更為開放和透明的科研平臺(tái)。

未來,AI將在科研工作中扮演越來越核心的角色,尤其是在推動(dòng)從基礎(chǔ)理論到實(shí)際應(yīng)用的快速轉(zhuǎn)化。通過建立智能化、自動(dòng)化的科研工作流,AI將幫助科學(xué)家們提高工作效率,縮短研究周期。隨著技術(shù)不斷進(jìn)步,AI4S將繼續(xù)引領(lǐng)科學(xué)研究的新方向。