12月8日,國家超級計算天津中心和國防科技大學(xué),聯(lián)合數十家合作團隊,共同發(fā)布“面向新一代國產(chǎn)E級超級計算系統的十大應用挑戰”,支撐解決世界科技前沿、經(jīng)濟主戰場(chǎng)、國家重大需求、人民生命健康領(lǐng)域的重大挑戰性問(wèn)題。
據介紹,新一代百億億次(E級)高性能計算機的研發(fā),是國家在新一代信息技術(shù)領(lǐng)域的重要部署,將有力驅動(dòng)國家信息技術(shù)產(chǎn)業(yè)創(chuàng )新發(fā)展,其自主化程度遠高于其他超算平臺,同時(shí)規模與性能更是大幅提升。此次十大應用挑戰的發(fā)布,其目的就是為了充分發(fā)揮新一代E級高性能計算機強大計算能力,研發(fā)適配國產(chǎn)超級計算系統的關(guān)鍵技術(shù)和應用軟件,構建新的國產(chǎn)E級超級計算應用生態(tài)。
挑戰一:磁約束聚變堆全裝置聚變模擬(人造小太陽(yáng))
可控聚變能源被認為是人類(lèi)未來(lái)應對能源和環(huán)境挑戰最有效的手段之一,而在磁約束聚變裝置設計中,最重要的問(wèn)題就是如何用更低的成本約束住更高密度、溫度的等離子體。
目前被廣泛認可的一個(gè)主要限制約束性能的機制是邊界和芯部產(chǎn)生的所謂微觀(guān)不穩定性。在先前的研究中由于多時(shí)間尺度的問(wèn)題,這些不穩定性通常采用回旋動(dòng)理學(xué)或磁流體力學(xué)等簡(jiǎn)化模型來(lái)描述,并且等離子體芯部和邊界需要分別建模。
在新一代國產(chǎn)E級計算機上,將可以直接采用電磁全動(dòng)理學(xué)這一經(jīng)典等離子體最基本的模型來(lái)直接模擬可分辨離子回旋半徑的磁約束聚變堆全裝置等離子體,并且不用區分邊界與芯部。借助幾何算法,使系統長(cháng)期演化模擬結果的可靠性可以得到保證,更準確而自洽地再現其內部所發(fā)生的不穩定性過(guò)程,尋求提升磁約束聚變裝置約束性能的機制。
此外,全裝置等離子體動(dòng)理學(xué)模擬還能得到對裝置尺度的等離子體演化更加保真的模型,更好地指導未來(lái)磁約束聚變堆等離子體的設計,將為可控聚變研究和聚變能源開(kāi)發(fā)提供強力支撐。
挑戰二:全尺寸航空航天飛行器超百億網(wǎng)格計算流體力學(xué)模擬
近年來(lái)的臨近空間飛行器復雜流動(dòng)問(wèn)題數值研究對認識高空高速下的流動(dòng)機理起到了重要作用。臨近空間飛行器飛行包絡(luò )覆蓋連續流域、滑移流域和過(guò)渡流域,存在復雜的氣動(dòng)力熱、稀薄非平衡效應、大動(dòng)壓下的多體分離、化學(xué)反應、等離子體等跨流域非定常多場(chǎng)耦合現象。
上一代超級計算機在計算能力和架構設計上無(wú)法進(jìn)行滿(mǎn)足精度和效率要求的臨近空間飛行器跨流域非定常多場(chǎng)耦合模擬,而新一代國產(chǎn)E級超級計算機在理論上有望突破計算瓶頸,從而實(shí)現超百億網(wǎng)格高精度全尺寸這一模擬。
臨近空間飛行器跨流域非定常多場(chǎng)耦合模擬研究一方面可以幫助我們全面認識飛行器在高空高速飛行狀態(tài)下的復雜耦合流動(dòng)現象,并辨識流動(dòng)機制及其對飛行器的影響,另一方面可以拓展新一代超級計算機上的數值風(fēng)洞構建能力,為航天各類(lèi)運載飛行器和航空國產(chǎn)大飛機等設計提供載體,使其更好地服務(wù)于我國戰略發(fā)展和建設。
挑戰三:數字細胞超億級原子體系動(dòng)力學(xué)模擬
在解讀生命奧秘特別是細胞生物機理方面,全原子分子動(dòng)力學(xué)模擬的虛擬實(shí)驗作用日益凸顯。
細胞內充斥了各種各樣的生物大分子和小分子,始終處于一種動(dòng)態(tài)的擁擠環(huán)境中,而擁擠環(huán)境對生物分子的擴散、聚集、構象變化和化學(xué)反應都會(huì )有顯著(zhù)影響。因此,在細胞尺度上對生物體系進(jìn)行全原子分子動(dòng)力學(xué)模擬將是認知生命過(guò)程的重要手段,但是目前的計算機很難提供足夠的算力來(lái)實(shí)現。
國產(chǎn)新一代的E級超級計算機理論上可以實(shí)現超億級甚至十億級原子數字細胞的分子動(dòng)力學(xué)模擬,使得未來(lái)細胞水平上的精準模擬成為可能。對細胞進(jìn)行全原子分子動(dòng)力學(xué)模擬,將使我們可以在虛擬實(shí)驗中對整個(gè)細胞及其內外的生物大分子的微觀(guān)動(dòng)態(tài)過(guò)程進(jìn)行高時(shí)空分辨的觀(guān)察,幫助我們全面深刻地去認識新冠病毒等如何侵入細胞、細胞如何進(jìn)行物質(zhì)信息交換等生命科學(xué)重大挑戰性問(wèn)題。
通過(guò)數字模擬獲得的知識,也將對未來(lái)的新藥研發(fā)、生命健康保障起到奠基性的作用。
挑戰四:對流尺度次公里級精細化數值天氣預報
對于尺度較小、發(fā)展劇烈的強對流天氣系統,往往難以預報,且容易造成破壞性災害,對于大城市的運行管理帶來(lái)很大的威脅。
隨著(zhù)天氣系統時(shí)空尺度的縮小,大氣的混沌屬性越發(fā)明顯,預報的不確定性加劇,這為精細化天氣預報帶來(lái)了很大的挑戰,目前基于探測技術(shù)的預警時(shí)效性和對系統演變的預測往往不足。
基于新一代國產(chǎn)E級超級計算機的強大計算能力,綜合超高分辨率模擬、集合預報、快速循環(huán)等技術(shù),提前0-6小時(shí)預報強對流天氣的觸發(fā)、演變、消亡,為單個(gè)對流系統提供連續、概率性的預測,改進(jìn)強對流引發(fā)的局地強降水、冰雹、突發(fā)大風(fēng)、龍卷的時(shí)空落區預報準確性。
挑戰五:百億級高效高通量虛擬藥物篩選
先導結構的發(fā)現和優(yōu)化作為新藥發(fā)現階段的研究核心,往往需要花費數年時(shí)間以及高達數億美元的資金,是藥物研發(fā)的關(guān)鍵技術(shù)瓶頸。因此如何生成新分子及優(yōu)化分子的關(guān)鍵屬性(如生物活性、成藥性、安全性和選擇性等)是影響藥物分子設計成敗的兩個(gè)關(guān)鍵問(wèn)題。
據估計,目前可利用的化學(xué)空間大小范圍約為10^23至10^60,即便是某些成熟數據庫的小分子數量也達到十億級別。如何在如此巨大的化學(xué)空間內如何進(jìn)行分子的智能生成、結構的快速演化搜索和性質(zhì)預測是藥物篩選所面臨的巨大挑戰。
目前,藥物篩選通??梢岳梅肿訉拥认鄬Υ致缘姆椒?,在之前的超級計算機上已經(jīng)可以實(shí)現對十億級別的小分子進(jìn)行快速的初篩,再利用更為精確的自由能擾動(dòng)計算等方法進(jìn)行更為準確的評價(jià)分析。
新一代E級超級計算機提供的強大算力能夠支撐百億級別藥物小分子的快速篩選,輔以更先進(jìn)的算法,可以實(shí)現虛擬藥物篩選效能幾十乃至上百倍的提升;同時(shí)高效的藥物篩選,還可以與中藥有效組分發(fā)現結合,推動(dòng)中藥研發(fā)的現代化。
挑戰六:面向通用人工智能的超大規模預訓練模型
深度神經(jīng)網(wǎng)絡(luò )是新一代人工智能的領(lǐng)航區,并且已經(jīng)成功應用于計算機視覺(jué)和自然語(yǔ)言處理等領(lǐng)域,取得了突出成效。
隨著(zhù)應用場(chǎng)景的豐富和發(fā)展,傳統基于有標注數據集的領(lǐng)域模型訓練和應用范式越來(lái)越無(wú)法適用人工智能應用的開(kāi)發(fā)和普及?;跓o(wú)標注數據的自監督學(xué)習技術(shù)和綜合能力好、通用能力強的大規模預訓練模型的出現,將數據驅動(dòng)的深度學(xué)習技術(shù)和通用人工智能推向新的發(fā)展階段。
近年來(lái),計算機和人工智能領(lǐng)域的專(zhuān)家和企業(yè)已經(jīng)在利用現有高性能計算機上完成了 1.75 萬(wàn)億參數的多模態(tài)預訓練模型開(kāi)發(fā),而國產(chǎn)新一代 E 級超級計算機使得支撐參數規模更大、通用性更強的模型(十萬(wàn)億甚至百萬(wàn)億以上)的訓練和應用成為可能。
大規模預訓練模型的研發(fā)部署,一方面,將推動(dòng)類(lèi)人機器人加快落地;另一方面,有通用模型做基礎,將大幅降低細分領(lǐng)域數據向智能化模型轉化的難度,有效推動(dòng)人工智能應用基礎設施的構建,提升工業(yè)現代化、數字經(jīng)濟發(fā)展、智能社會(huì )數字化治理能力。
挑戰七:FAST超大規模觀(guān)測數據的高分辨率巡天圖像處理
中性氫巡天是 “中國天眼”(FAST射電望遠鏡)的重要科學(xué)目標之一,通過(guò)探測可觀(guān)測宇宙范圍內中性氫的分布情況,為宇宙起源與演化、暗物質(zhì)與暗能量等前沿科學(xué)領(lǐng)域的研究提供支撐。
受視場(chǎng)所限,望遠鏡每次觀(guān)測只能覆蓋有限天區,中性氫巡天觀(guān)測持續時(shí)間可達數年,所積累的觀(guān)測數據需拼接融合才能獲得完整的高分辨率巡天圖像。在中性氫巡天數據處理流程中,網(wǎng)格化(Gridding)是計算量最大且I/O最為密集的環(huán)節,是制約中性氫巡天數據處理與成果產(chǎn)出效率的瓶頸。
新一代E級超級計算機的數據處理能力配合高性能網(wǎng)格化算法,能夠應對PB量級的中性氫巡天觀(guān)測數據,從而為國之重器“中國天眼”能夠“早出成果、多出成果,出大成果、出好成果”提供強大助力,促生天文學(xué)基礎與前沿領(lǐng)域的重大發(fā)現。
挑戰八:全球尺度地震全波形反演
地震全波形反演是當前分辨率最高的成像方法,是研究地球內部結構和動(dòng)力學(xué)演化過(guò)程的強有力工具,還可為礦產(chǎn)資源和油氣勘查提供關(guān)鍵支撐。
在過(guò)去十年里,地震科學(xué)領(lǐng)域專(zhuān)家已經(jīng)在上一代超級計算機上實(shí)現了區域尺度的低頻帶彈性波全波形反演研究。
國產(chǎn)新一代的E級超級計算機將可以實(shí)現全球尺度的、包括地震波衰減特征在內的高頻帶粘彈性地震波場(chǎng)傳播模擬和波形成像研究。全球尺度高頻帶粘彈性地震波形反演一方面可以獲得地球內部高精度成像結果,加深我們對板塊構造、俯沖帶和造山帶形成和演化的認識,另一方面可以提供地球內部各圈層(中下地殼、巖石圈、軟流圈等)物質(zhì)和能量交換的地震學(xué)證據,為研究地球深部成礦作用和火山/地震活動(dòng)提供依據,幫助人類(lèi)更全面的認知地質(zhì)演化,理解類(lèi)地行星的形成發(fā)展。
挑戰九:全腦千億神經(jīng)元動(dòng)力學(xué)仿真
近年來(lái)的神經(jīng)科學(xué)研究獲取了大量的大腦結構和活動(dòng)的數據,以此來(lái)理解大腦的工作機制。對于大腦的高級功能,如運動(dòng)控制和思考等功能的解析和再現,迫切需要建立起人類(lèi)全腦規模的仿真神經(jīng)網(wǎng)絡(luò )平臺。
人類(lèi)的大腦有860億神經(jīng)元,在過(guò)去的十年里,計算神經(jīng)科學(xué)領(lǐng)域的專(zhuān)家在上一代的超級計算機上已經(jīng)進(jìn)行了人腦百分之一大小規模的腦回路仿真。而新一代的E級超級計算機在理論可以實(shí)現包括大腦皮層、小腦和基底神經(jīng)節在內的全腦神經(jīng)回路的模擬。
人類(lèi)全腦回路的仿真和研究,一方面在可以幫助我們理解大腦的思考等高級功能,開(kāi)發(fā)類(lèi)腦人工智能算法。另一方面,帕金森癥,亨廷頓舞蹈癥等大腦疾病的發(fā)病機理也將能夠得到進(jìn)一步的分析和驗證。此外,使用仿真腦模型構建基于脈沖神經(jīng)網(wǎng)絡(luò )的神經(jīng)模態(tài)機器人,能夠提升現有機器人系統的感知與決策水平。
挑戰十:完全分辨率的全球次中尺度海洋數值模擬
氣候變化是全球可持續發(fā)展所面臨的重大挑戰,也是科學(xué)界面臨的最具挑戰性的科學(xué)問(wèn)題之一,海洋則是控制氣候系統季節內、季節、年際、年代際變率的重要分量。
近年來(lái),隨著(zhù)海洋觀(guān)測的飛速發(fā)展,海洋中尺度、次中尺度過(guò)程的許多機理被不斷揭示,海洋多尺度相互作用的特征更加清晰,對海洋環(huán)流數值模擬也提出了更高的要求,分辨率中尺度、次中尺度過(guò)程及其與大氣的相互作用成為重要的研究方向。
在過(guò)去的10年期間,全球的科學(xué)家在此方向作出了不懈努力,將全球的海洋模擬提高到部分分辨率次中尺度渦(2km)的分辨率,而我國的科學(xué)家也自主開(kāi)發(fā)了全球3-5km的海洋模式,基本可以完全分辨開(kāi)闊大洋的中尺度過(guò)程。新一代的E級超級計算機可以實(shí)現完全分辨率次中尺度過(guò)程的模擬,幫助科學(xué)家全面理解海洋內部多尺度相互作用過(guò)程,以及海洋能量串級過(guò)程,并進(jìn)一步提高對海洋環(huán)流以及整個(gè)氣候系統的模擬能力。
來(lái)源:科技日報