“到2030年,所有高端計算設備將自帶人工智能(AI)支持功能,高性能計算仿真將利用人工智能平臺提高性能,人工智能也將重塑計算仿真?!苯赵诘聡ㄌm克福舉辦的國際超算大會(huì )(ISC19)上,國家超級計算廣州中心主任盧宇彤在談到未來(lái)高性能計算機(HPC)與AI的融合時(shí)表示,未來(lái)高性能計算、物聯(lián)網(wǎng)、大數據和人工智能將實(shí)現深度融合。
“計算是引擎,數據是燃料?!北R宇彤認為,到那時(shí),高性能計算將不再比拼“肌肉”、只追求規模和性能,更加智慧的高性能計算系統將成為主流。
AI對計算的需求潛力大
“目前AI的發(fā)展還在智能感知階段,在智能認知方面還沒(méi)有很成熟的研究。從這個(gè)角度而言,AI對計算能力的需求,潛力非常大?!眹也⑿杏嬎銠C工程技術(shù)研究中心總工程師、中國工程院院士陳左寧曾在2018年10月下旬舉辦的第十四屆全國高性能計算學(xué)術(shù)年會(huì )上專(zhuān)門(mén)探討“云端AI高性能計算計算能力及計算環(huán)境研究”,在會(huì )上她提出,現階段HPC與AI融合問(wèn)題的關(guān)鍵在于,在HPC體系結構發(fā)生改變的過(guò)渡階段,如何在A(yíng)I的演進(jìn)階段支撐其計算能力需求,“這是目前HPC應該考慮的問(wèn)題”。
“加大對大數據與人工智能等新興超算應用的支撐,也是中國超算未來(lái)的目標之一?!痹贗SC19的焦點(diǎn)論壇“E級計算機面臨的挑戰與愿景”上,國家重點(diǎn)研發(fā)計劃“高性能計算重點(diǎn)專(zhuān)項”總體專(zhuān)家組組長(cháng)、中山大學(xué)數據科學(xué)與計算機學(xué)院院長(cháng)錢(qián)德沛表示。他認為,目前來(lái)看,AI與HPC之間的聯(lián)系還處于一個(gè)“初級狀態(tài)”。
“AI有大量的數據、訓練任務(wù)需要超級計算的支持,同時(shí)HPC也可以把AI應用到新的領(lǐng)域,比如利用人工智能更精準地完成天氣預報等。但從長(cháng)遠來(lái)看,AI與HPC可能還存在更深層的關(guān)系,轉變人工智能的初衷就是從人的智能向計算轉變的一個(gè)啟發(fā),它對未來(lái)的計算模式可能會(huì )帶來(lái)非常重要的影響?!卞X(qián)德沛表示。
擁有“支撐AI的能力”成趨勢
HPC與AI的深度融合,已經(jīng)是大勢所趨。自2018年6月以來(lái),新上榜TOP500的超級計算機,前十名都聲稱(chēng)有支持AI的能力?!皬倪@里能夠看出,對于云端AI的支撐能力,已經(jīng)是HPC界比較關(guān)注的一點(diǎn)?!标愖髮幈硎?。
目前排名TOP500第一位的Summit超級計算機,就是“非常典型支撐AI”的HPC?!捌渑止濣c(diǎn)的設計使其單節點(diǎn)存儲容量相當大,GPU的訪(fǎng)存也非??捎^(guān),綜合下來(lái)一個(gè)胖節點(diǎn)的計算能力相當強,基本可滿(mǎn)足大多AI‘一個(gè)模型放在里邊做’的需求了?!标愖髮幗忉屨f(shuō)。
據了解,Summit支撐AI的能力已經(jīng)達到3.3E,高性能的胖節點(diǎn)設計使系統總節點(diǎn)數減少,從而降低了應用擴展難度,大容量的多級高效存儲及其間的硬件一致性支持,加之高速好用的本地存儲等的綜合作用下,使其局部的計算能力非常強,非常適合深度神經(jīng)網(wǎng)絡(luò )(DNN)這類(lèi)AI應用的提升。另外,來(lái)自中科院、清華大學(xué)等單位的超算團隊在“神威·太湖之光”上也運行了許多AI應用,并在其上提供完整的AI軟件。
中科曙光高性能計算產(chǎn)品事業(yè)部首席科學(xué)家吉青在接受《中國科學(xué)報》關(guān)于類(lèi)似問(wèn)題的采訪(fǎng)時(shí)說(shuō),AI與HPC將會(huì )相互促進(jìn)、共同生長(cháng)。她認為,AI是信息化發(fā)展到一定階段的必然。AI伴隨著(zhù)海量數據,大數據處理往往通過(guò)AI實(shí)現?!叭斯ぶ悄鼙举|(zhì)之一是大數據的一種處理技術(shù),它的出現也在改變傳統的高性能計算?!?/p>
“比如架構的改變,其實(shí)是計算核心的改變。從原來(lái)的純CPU變成CPU+GPU,就是隨著(zhù)應用需求的改變而衍生的架構改變?!奔嗾f(shuō),曙光目前還在探索CPU+GPU+AI芯片的架構革新,比如支持寒武紀AI芯片卡組等比較流行的AI芯片,以匹配廣泛的AI+行業(yè)應用。
在勞倫斯伯克利國家實(shí)驗室超算科學(xué)家、超算TOP500榜單聯(lián)合創(chuàng )始人埃里奇·斯特羅邁爾看來(lái),HPC并不天然適合AI計算,但傳統的HPC架構,有必要隨著(zhù)AI計算的需要,調優(yōu)和改變。
“改變的發(fā)生,可能會(huì )影響未來(lái)TOP500的測評規則——事實(shí)上,我們也正在考慮測評手段的與時(shí)俱進(jìn)?!卑@锲妗に固亓_邁爾表示。
陳左寧也表示,目前HPC對AI計算支持的評價(jià),光靠Linpack測試是不夠的,還要看能效、性?xún)r(jià)比等指標。
仍待進(jìn)一步探究
不過(guò),回顧國內外較為關(guān)注的E級計算機,E級計算機對云端AI、對與訓練有關(guān)的計算能力的支撐,到底要不要做,做到什么程度,目前還沒(méi)有結論。
“從我國發(fā)布的將要建設的E級計算機的要求來(lái)看,并沒(méi)有專(zhuān)門(mén)對AI計算支撐的標準或要求。國內研制E級計算的3家單位,現在對云端AI計算的支持還在探索?!标愖髮幈硎?。
不過(guò)陳左寧表示,AI對計算能力的需求潛力已毋庸置疑。但由于A(yíng)I發(fā)展的歷史尚短,自身無(wú)論計算理論、方法算法都尚不完整,特別是數學(xué)理論的基礎還很不堅實(shí),因此,還不能如傳統的數值模擬一樣,能夠非常明確地提出對HPC計算能力的要求。
“也就是說(shuō),AI的計算理論還沒(méi)有發(fā)展到它能對HPC明確提出很高的需求階段。但反過(guò)來(lái)看,如果AI能夠達到人的智能水平,肯定會(huì )對計算能力、存儲能力等的需求非常高?!标愖髮幷f(shuō),還應注意到,深度學(xué)習僅僅是AI算法的一個(gè)分支,面向AI的云端高性能計算環(huán)境需要廣泛適應包括深度學(xué)習在內的多種應用模式,未來(lái)的應用需求仍有待進(jìn)一步研究。
摘自《中國科學(xué)報》