來(lái)源:經(jīng)濟日報
“天河二號”是國防科大承擔完成的國家863計劃和“核高基”國家科技重大專(zhuān)項項目,2013年11月在國家超算廣州中心投入運行,向國內外用戶(hù)開(kāi)放使用。目前,“天河二號”已構建起材料科學(xué)與工程計算、生物計算與個(gè)性化醫療、全數字設計與裝備制造、能源及相關(guān)技術(shù)數字化設計、地球科學(xué)與環(huán)境工程計算、智慧城市與大數據處理等六大應用服務(wù)平臺,先后在基因分析與測序、大型飛機和高速列車(chē)設計、生物醫藥、電子政務(wù)及智慧城市等方面發(fā)揮了重要作用,取得了顯著(zhù)的經(jīng)濟效益和社會(huì )效益。
在2014年11月20日召開(kāi)的世界超級計算機大會(huì )上,“天河二號”在國際TOP500組織首次正式發(fā)布的超級計算機高性能共軛梯度(HPCG)基準測試排行榜上,位居世界第一。此前,由該組織發(fā)布的第四十四屆世界超級計算機500強排行榜中,“天河二號”再次位居榜首,獲得世界超算“四連冠”。近日,《經(jīng)濟日報》記者采訪(fǎng)了“天河二號”研究團隊相關(guān)人員、國家超算天津中心負責人,以探尋國之重器“天河二號”背后的故事。
超算之巔的角逐
四捧冠軍獎杯,對于中國超算團隊而言,無(wú)疑是一件令人歡欣鼓舞的大喜事,然而對其他老牌超算強國來(lái)說(shuō),他們的心里像打翻了調味瓶,五味雜陳。強手“叫板”也隨之而來(lái),就在這次世界超級計算機500強榜單發(fā)布前夕,排位第二的美國公布了“珊瑚”計劃,表示將投資3.25億美元建造兩臺超級計算機,其運算速度有可能達到“天河二號”的3到5倍。
“在超算領(lǐng)域,國際競爭由來(lái)已久,在‘天河一號’奪冠之前,美日之間的‘第一之爭’早已存在。”天河高性能計算機系統副總設計師朱小謙說(shuō)。中國計算機學(xué)會(huì )高性能計算專(zhuān)業(yè)委員會(huì )秘書(shū)長(cháng)張云泉告訴記者,“美日特別在意其超算是否世界第一,一旦失去‘第一’稱(chēng)號,都會(huì )迫不及待地奪回來(lái)。”實(shí)際情況也的確如此,“天河一號”在2010年底首次奪冠后,遭遇福島核事故的日本仍然緊急撥款加快其超級計算機“京”的研制,用半年時(shí)間登上了冠軍寶座,隨后美國的“紅杉”和“泰坦”又先后搶得世界第一的位置。
“你方唱罷,我登場(chǎng)”,冠軍的寶座常常不等捂熱,就被新的競爭對手奪去。人們不禁要問(wèn),如此激烈的競爭到底是為了什么?
回答這個(gè)問(wèn)題還得從超級計算機能做什么說(shuō)起。記者日前來(lái)到國家超算天津中心采訪(fǎng),這里運行著(zhù)我國首臺千萬(wàn)億次超級計算機——“天河一號”。投運近5年來(lái),“天河一號”以其超強的計算能力、精準的計算結果贏(yíng)得了眾多用戶(hù)的青睞。目前中心每天運營(yíng)的計算任務(wù)超過(guò)1000個(gè)、提供計算服務(wù)機時(shí)140萬(wàn)小時(shí)、服務(wù)用戶(hù)數已超過(guò)600家。“‘天河一號’的魅力,通俗講是能算天、算地、算人。”國家超算天津中心主任劉光明說(shuō)。
算天:“大氣科學(xué)和地球流體力學(xué)數值模擬國家重點(diǎn)實(shí)驗室”的研究員利用“天河一號”完成了跨越千年氣候變化模擬,并利用自主開(kāi)發(fā)的氣候模式向聯(lián)合國氣候變化大會(huì )提交了IPCC報告。國家超算天津中心研究員孟祥飛說(shuō),“自從中國科學(xué)家用‘天河一號’建立了氣候變化模型,中國不僅拿出了自己的氣候影響依據,而且建立的模型還成為國際公認的模型標準,為中國在這一領(lǐng)域贏(yíng)得了話(huà)語(yǔ)權。”
算地:基于“天河一號”開(kāi)展的高性能石油勘探數據處理軟件開(kāi)發(fā)與應用,解決了我國石油勘探領(lǐng)域自主應用軟件的大規模數據處理能力問(wèn)題,使我國大連片、高密度石油勘探地震數據處理能力提升50倍以上,達到世界領(lǐng)先水平。
算人:分析人類(lèi)基因,解讀生命奧秘,如今都離不開(kāi)大數據的計算和處理。中科院、軍事醫學(xué)科學(xué)院、北京生命科學(xué)研究所等單位利用“天河一號”開(kāi)展了抗擊癲癇、艾滋病、癌癥等領(lǐng)域研究,取得了一批具有國際先進(jìn)水平的成果。
“‘天河一號’不僅為科學(xué)研究、科技創(chuàng )新提供了一個(gè)更高的支點(diǎn),更是給產(chǎn)業(yè)發(fā)展提供了一條更快更好的跑道。”劉光明說(shuō)。正是有了“天河一號”的支撐,我國部分產(chǎn)業(yè)領(lǐng)域的核心競爭力正在構建。
無(wú)論是模擬氣候變化,還是演示地震海嘯;無(wú)論是設計航空航天飛行器,還是研制國產(chǎn)新型發(fā)動(dòng)機;或者是基因測序、高速列車(chē)設計制造,超級計算機都能夠完成分析、計算和處理。“超級計算機就像能夠預知未來(lái)的水晶球,一切都可以在計算機上進(jìn)行模擬。”美國田納西大學(xué)計算機學(xué)教授杰克·唐加拉說(shuō),“超級計算機越快,計算結果越精確,意味著(zhù)工程師能設計出更好的產(chǎn)品,大到飛機和輪船,小到藥品和服裝面料。”
從“銀河”到“天河”
“高性能計算機是名副其實(shí)的‘國之重器’,其研制與應用水平不僅代表國家的科技發(fā)展水平,更是國家在創(chuàng )新創(chuàng )造和經(jīng)濟建設中塑造核心競爭力的關(guān)鍵武器。”國家863計劃高性能計算機及其核心軟件重大專(zhuān)項總體組組長(cháng)錢(qián)德沛如是評價(jià)。
正因為如此,我國超級計算機的研發(fā)一開(kāi)始就遭到了國外的嚴密封鎖。
有兩件事雖然過(guò)去很多年,卻總是被“天河人”提起——
改革開(kāi)放前,我國由于沒(méi)有國際先進(jìn)水平的高性能計算機,勘探的石油礦藏數據和資料不得不用飛機送到國外去處理,不僅費用昂貴,而且受制于人;國內一家單位想進(jìn)口一臺運算速度每秒400萬(wàn)次的計算機,外方居然提出:要為這臺機器建一個(gè)安全“玻璃房子”,中方人員上機操作,必須在外方監控下進(jìn)行,不得開(kāi)展合同以外的研究。
往事歷歷在目,始終激勵“天河人”奮勇拼搏,向世界超算的“珠穆朗瑪峰”攀登。
“中國要搞四個(gè)現代化,不能沒(méi)有巨型計算機!”1978年,鄧小平同志高瞻遠矚,把研制巨型計算機的任務(wù)交給國防科技大學(xué)。國防科大的一大批科技人員,瞄準世界先進(jìn)巨型機技術(shù)奮力攻關(guān),僅用5年時(shí)間就研制出我國第一臺被譽(yù)為“爭氣機”的億次巨型計算機。1983年11月,“銀河”億次巨型計算機展現在世人面前,實(shí)現了我國巨型機零的突破。此后,他們又相繼研制出“銀河”系列巨型機,將我國超級計算技術(shù)一步步推向國際前沿。
跨入新世紀,“天河人”吹響了攀登世界科技高峰的集結號——早日研制出我國的千萬(wàn)億次超級計算機系統。“巨型計算機的發(fā)展規律是每10年性能提高1000倍。2000年的國際先進(jìn)水平是1萬(wàn)億次,到2010年肯定會(huì )達到千萬(wàn)億次級。要占領(lǐng)制高點(diǎn),必須盡快開(kāi)始研制千萬(wàn)億次計算機。”當時(shí)的“天河一號”總設計師、現任國防科大校長(cháng)楊學(xué)軍說(shuō)。
這一步是不是跨得太大?不少人有疑問(wèn),但國家戰略不容等待。
重擔又壓在“天河人”的肩上。血液里流淌著(zhù)“銀河精神”的“天河人”再一次迎難而上?;貞浧甬敃r(shí)的情景,職業(yè)生涯與中國超級計算機發(fā)展史幾乎“同齡”,曾參與我國銀河—Ⅱ、銀河—Ⅲ研制的劉光明感慨地說(shuō),“確實(shí)非常不容易。”
每一項技術(shù)的背后,都是超常的付出:僅僅為了將網(wǎng)絡(luò )互連軟件的性能參數調整到適應硬件的最佳狀態(tài),在3個(gè)月里,“天河人”進(jìn)行了上億次測試實(shí)驗。他們幾乎是每天工作十幾個(gè)小時(shí),全年僅春節期間休息3天。而對這一切,作為“天河二號”主機系統主任設計師的蔣句平認為再平常不過(guò)。當記者請他講講過(guò)去攻堅克難的故事,蔣句平卻一時(shí)語(yǔ)塞,想不起來(lái)。“億萬(wàn)星辰匯銀河,世人難知有幾多。神機妙算巧安排,笑向繁星任高歌。”也許只有凌晨三四點(diǎn)還依舊燈火通明的“天河樓”能告訴我們這一切。
付出的汗水有了收獲。2010年11月,“天河一號”問(wèn)鼎世界第一;兩年半后,2013年6月,“天河二號”摘取世界冠軍,峰值計算速度也從每秒4.7千萬(wàn)億次躍升到每秒5.49億億次,實(shí)現由千萬(wàn)億次級到億億次級的跨越。
從“銀河”到“天河”,從“天河一號”到“天河二號”,“天河創(chuàng )新”團隊為了完成國家使命,以超前的眼光逐夢(mèng)“超算”世界,交出了一份份精彩答卷。
蔣句平告訴記者,目前“天河”團隊的平均年齡不到40歲。曾經(jīng)參與“天河一號”研制的年輕技術(shù)人員,如今已成長(cháng)為“天河二號”研制的骨干力量,一代代“天河人”接力前行,成為支撐我國未來(lái)高性能計算的脊梁。
獨辟蹊徑求突破
中國超級計算機的發(fā)展無(wú)疑給世界帶來(lái)了無(wú)數驚嘆。
3年多時(shí)間里,兩次研發(fā)出全球速度最快的超級計算機;短短十幾年里擁有超級計算機的數量,從零躍居世界第二;最近10年,中國超級計算機性能提升了5000倍,而同期美國超級計算機性能只提升了500倍……
是什么造就了中國超級計算機的跨越式發(fā)展?錢(qián)德沛說(shuō),銀河、天河系列之所以取得如此驕人的業(yè)績(jì),得益于一系列重大技術(shù)的自主創(chuàng )新,也清楚地表明了中國科技實(shí)力的巨大進(jìn)步。
超級計算機是集成數以萬(wàn)計CPU的龐然大物。按傳統的方法,提高超級計算機的運算速度可以是增加處理器數量,也可以是增加CPU核數。蔣句平告訴記者,“傳統的方法難以為繼,增加CPU數主要受到功耗、占地面積、系統可靠性方面的限制。”據介紹,按傳統方法構建一臺每秒百億億次超級計算機,需要占地1.3萬(wàn)平方米,將近兩個(gè)足球場(chǎng)那么大;需要用電320兆瓦,相當于一個(gè)大中型城市的用電量。
很顯然,按照傳統方案根本行不通,首先必須解決機器規模增長(cháng)帶來(lái)的一系列煩惱與挑戰:如何降低功耗,節省能源?怎么提高密度,節省機房空間?如何突破內存和網(wǎng)絡(luò )I/O的瓶頸,補足系統的短板?如何優(yōu)化并行軟件的開(kāi)發(fā),提高效率,保證數據一致性?
再難也要上,時(shí)任“天河一號”總設計師楊學(xué)軍決定帶領(lǐng)他的團隊,在世界上率先采用CPU+GPU異構融合體系結構,利用GPU加速通用應用程序運行。幾年來(lái),這種結構因其低能耗、低成本、高集成度等優(yōu)點(diǎn),逐漸成了國際主流。
在“天河”團隊的全體努力下,類(lèi)似的自主創(chuàng )新成果一個(gè)接一個(gè)。如今,“天河二號”的多項自主關(guān)鍵技術(shù)令世界矚目:“新型異構多態(tài)體系結構”大幅度提高了系統的計算速度;高速互連系統性能是當前國際商用互連系統的兩倍,綜合化能耗控制機制實(shí)現了國際先進(jìn)的能效比;自主研制出當前國內主頻最高的新一代高性能通用“飛騰—1500”CPU,有力支撐了高吞吐率和高安全的信息服務(wù)類(lèi)應用;高密度、高精度組裝結構使得系統的占地面積與“天河一號”相當、性能卻提升了11.6倍……
“可以說(shuō),如今中國超算系統的整體研制能力已處于國際前列,體系結構等部分技術(shù)已領(lǐng)先國際水平。”朱小謙說(shuō)。從局部突破到綜合技術(shù)領(lǐng)先,從奮力追趕到逐步超越,世界超級計算機的發(fā)展史上已留下“中國創(chuàng )造”的深深印記。
因為有了一系列自主創(chuàng )新成果,中國的超級計算機科研工作者在世界同行中贏(yíng)得尊重。劉光明至今仍清楚地記得,過(guò)去要參觀(guān)國外超算公司、參加國外超算學(xué)術(shù)會(huì )議非常困難。即使有幸參加,中方人員的行程都會(huì )被跟蹤,看了什么,問(wèn)了什么,都會(huì )被記錄上報。如今,主動(dòng)邀請代替了百般拒絕,熱情相擁代替了冷淡對待。歐盟第七框架科研計劃與“天河一號”合作項目顧問(wèn)、德國于利希超級計算中心教授BerndMohr表示,中國在超級計算機領(lǐng)域經(jīng)驗豐富,歐盟希望通過(guò)這一合作,對未來(lái)高性能計算發(fā)展規劃提供指導和參考。
“當然,我國超算領(lǐng)域也有短板。”錢(qián)德沛告訴記者,最大短板在于應用,軟件方面與國際先進(jìn)水平還有很大差距,希望國家把超級計算機作為關(guān)系國家長(cháng)遠發(fā)展的重大基礎設施建設持續支持,讓超級計算機這一“國之重器”更好地發(fā)揮作用。