智能機器人幫助員工“尋醫問(wèn)診”
智慧能源助力美麗中國建設
智慧用能平臺助力鄉村智能電氣化
今年的新冠肺炎疫情,是人類(lèi)共同面臨的災難。新一代信息技術(shù)不僅在抗疫過(guò)程中發(fā)揮了巨大的作用,也使得我們離“智慧社會(huì )”越來(lái)越近。人們的很多生活和工作從線(xiàn)下搬到了線(xiàn)上。從早上醒來(lái)第一眼去查看疫情數據、查看同乘同航是否有確診,到網(wǎng)課輔導、在線(xiàn)問(wèn)診、生鮮快遞;從遠程打卡、線(xiàn)上招聘、線(xiàn)上會(huì )議到文檔協(xié)同、工作提交,從線(xiàn)下到線(xiàn)上,疫情加速了社會(huì )的智慧進(jìn)化。
1、疫情加速我國經(jīng)濟活動(dòng)的變革
疫情加速了經(jīng)濟活動(dòng)的線(xiàn)上變革。企業(yè)選擇線(xiàn)上辦公,各種在線(xiàn)辦公平臺用戶(hù)規模指數級增長(cháng),其中釘釘平臺超過(guò)1000萬(wàn)家企業(yè)、2億人協(xié)同辦公;騰訊會(huì )議系統上線(xiàn)僅兩月,日活躍用戶(hù)就超過(guò)千萬(wàn);學(xué)校選擇線(xiàn)上教學(xué),其中釘釘平臺超過(guò)14萬(wàn)所學(xué)校、1.2億學(xué)生在線(xiàn)上課;騰訊課堂有超過(guò)140萬(wàn)老師,每天有2000萬(wàn)中小學(xué)生在騰訊課堂上學(xué)習。工信部的數據顯示,春節期間,移動(dòng)互聯(lián)網(wǎng)流量271.6萬(wàn)TB,同比增長(cháng)36.4%。經(jīng)濟活動(dòng)的線(xiàn)上變革,讓大家在這個(gè)過(guò)程中體驗到了信息科技的價(jià)值和效率。
第二個(gè)明顯的變化是社會(huì )服務(wù)和社會(huì )治理更加高效智能。疫情期間,運營(yíng)商推出了“通信大數據行程卡”,可以對手機用戶(hù)14天內到訪(fǎng)的地區進(jìn)行證明,截至目前,累計查詢(xún)量已經(jīng)超過(guò)了4.5億;中國鐵路提供了確診病例密接者查詢(xún)服務(wù)。這些服務(wù)為社會(huì )防疫防控提供了有力支持。騰訊、阿里、浪潮提供的健康碼在山東、北京、廣東等省市陸續上線(xiàn),幾乎覆蓋了所有出行人口??梢灶A想,健康碼將會(huì )成為未來(lái)傳染病防控的必備手段。
在工業(yè)生產(chǎn)方面,去年中國工業(yè)機器人裝機量占全球的36%,用于建設數字化車(chē)間和智能工廠(chǎng),成為全球最大的智能制造市場(chǎng),預計今年中國智能制造市場(chǎng)規模將超過(guò)2200億元,智能制造升級將進(jìn)一步提速。
這里面典型的例子就是浪潮智能工廠(chǎng)。整個(gè)生產(chǎn)制造過(guò)程彈性、透明、可追溯,智能技術(shù)貫穿了生產(chǎn)制造的全周期,實(shí)現同樣的產(chǎn)能,用工數量下降50%,生產(chǎn)效率提高3倍,訂單交付周期從18天縮短至5~7天。
利用智能工廠(chǎng),浪潮保證了在疫情期間快速復工復產(chǎn)。2月1日,浪潮接到用于疫情防控的緊急訂單。2月2日,浪潮智能工廠(chǎng)復工,迅速投入生產(chǎn),按客戶(hù)要求,及時(shí)交付到抗疫一線(xiàn)。如果是傳統的工廠(chǎng),要在一天之內復工生產(chǎn),幾乎不可能,因為很難在短時(shí)間內將幾百個(gè)工人招回來(lái),何況疫情期間,全國都在管控。
2、智算中心是重要的基礎設施
看得見(jiàn)的是各種智慧服務(wù),看不見(jiàn)的是新型的基礎設施。支撐社會(huì )智慧化轉型的正是我們一直說(shuō)的以云計算、大數據、人工智能為核心的智慧計算。
疫情期間,騰訊和阿里每天都在擴充云計算資源,用于支撐視頻會(huì )議、在線(xiàn)辦公等業(yè)務(wù)。百度地圖則利用其每天響應位置服務(wù)請求千億次所產(chǎn)生的大數據,通過(guò)數據定向、分析等途徑助力流行病學(xué)調查。而浪潮的智能工廠(chǎng)里面各種智能設備以及背后的路徑規劃、圖像識別等算法,也是高效復工復產(chǎn)的必要條件。
我們見(jiàn)證了智慧計算如何在這場(chǎng)戰疫中發(fā)揮巨大作用。3月4日,我國決定對人工智能、大數據中心等新基建提速,這也是在為智慧計算的發(fā)展提速。計算力就是生產(chǎn)力,智慧計算改造升級了生產(chǎn)力三要素,最終驅動(dòng)了人類(lèi)社會(huì )的轉型升級。智慧計算將勞動(dòng)者由人變成了人加上人工智能,勞動(dòng)者可以呈現指數增長(cháng),將數據變成了一種新的生產(chǎn)資料,從有形到無(wú)形,生生不息,越用越多,將計算力驅動(dòng)的信息化設備變成了生產(chǎn)工具,也是指數增長(cháng),生產(chǎn)力得到了前所未有的解放。
伴隨生產(chǎn)力的升級,社會(huì )基礎設施也在產(chǎn)生變化。農業(yè)時(shí)代的基礎設施比較簡(jiǎn)單,就是水利、交通等;工業(yè)時(shí)代,則是我們熟悉的鐵公機、電網(wǎng)等;那么智慧時(shí)代必將需要新型的基礎設施。
我們可以和電力基礎設施做個(gè)類(lèi)比。電力基礎設施提供電力服務(wù),其核心是生產(chǎn)電力的地方,就是發(fā)電廠(chǎng),像三峽電站、大亞灣核電站;智慧時(shí)代的新型基礎設施,要能夠對外提供各種算力的服務(wù)、數據的服務(wù)和AI的服務(wù)等。那么其核心就是計算力的生產(chǎn)中心。
計算是在發(fā)展的,從最初的數值計算逐漸演變?yōu)榭茖W(xué)計算、關(guān)鍵計算和智慧計算。每種計算都有相應的計算力中心去支撐??茖W(xué)計算的算力中心是超算中心。承載當前企業(yè)應用、政府應用和個(gè)人應用的算力中心是數量眾多的各類(lèi)數據中心。當前人工智能計算需求正呈指數級增長(cháng),未來(lái)將占據80%以上的計算需求,承載這種需求的就是AI算力中心,即智算中心。
智算中心是智慧時(shí)代最主要的計算力生產(chǎn)中心和供應中心,它以融合架構計算系統為平臺,以數據為資源,能夠以強大算力驅動(dòng)AI模型來(lái)對數據進(jìn)行深度加工,源源不斷產(chǎn)生各種智慧計算服務(wù),并通過(guò)網(wǎng)絡(luò )以云服務(wù)形式向組織及個(gè)人進(jìn)行供應。它正在成為經(jīng)濟社會(huì )運行的重要基礎設施。
3、開(kāi)放標準、集約高效和普適普惠
智算中心要成為新基建的原動(dòng)力,必須滿(mǎn)足以下三個(gè)基本要求:開(kāi)放標準、集約高效和普適普惠。開(kāi)放標準,要求智算中心從硬件到軟件、從芯片到架構、從建設模式到應用服務(wù)都應該是開(kāi)放的、標準的;集約高效,要求智算中心的建設要有超大規模,要采用領(lǐng)先的技術(shù),保證自身的先進(jìn)性;普適普惠,則要求智算中心發(fā)揮基礎設施的社會(huì )價(jià)值,服務(wù)大眾。
首先是開(kāi)放標準。開(kāi)放的邊界越來(lái)越廣闊,從最初的操作系統、數據庫、中間件的開(kāi)源到云和大數據、算法框架等基礎軟件的開(kāi)源,再到以Risc-V為代表的芯片的開(kāi)放,以OCP、ODCC為代表的計算硬件的開(kāi)放。由軟件到硬件,從芯片到數據中心,開(kāi)放變革了IT產(chǎn)業(yè)的生產(chǎn)模式和應用服務(wù)模式,持續推動(dòng)著(zhù)信息技術(shù)的發(fā)展,促進(jìn)了整個(gè)IT產(chǎn)業(yè)的生態(tài)繁榮。開(kāi)源開(kāi)放的IT,才是一個(gè)健康的IT。開(kāi)源開(kāi)放的軟硬件,才是智算中心建設的需要。
目前,幾乎所有頂級互聯(lián)網(wǎng)數據中心已經(jīng)大規模落地了開(kāi)放計算服務(wù)器,通信、金融、能源等關(guān)鍵領(lǐng)域的TOP企業(yè)也紛紛加入這些開(kāi)源組織并在數據中心建設中加以實(shí)踐。像OpenStack、K8S、Hadoop、TensorFlow等面向云計算、大數據、人工智能等場(chǎng)景的開(kāi)源基礎軟件,已經(jīng)成為智算中心軟件平臺的事實(shí)標準,超過(guò)80%的企業(yè)都在其數據中心中應用了開(kāi)源軟件技術(shù)。
開(kāi)放計算帶來(lái)的好處是顯而易見(jiàn)的,以浪潮的某個(gè)大型數據中心客戶(hù)為例,使用開(kāi)放計算架構能夠節約電力30%,系統故障率降低90%,投資收益提高33%;并且運維效率提升3倍以上,交付速度可達到每天1萬(wàn)臺。
基礎設施必然要以規模效應來(lái)實(shí)現降本增效,要能夠快速建設。這就要求智算中心的建設就好比現在蓋房子一樣,采用預生產(chǎn)的、標準化模塊化的硬件來(lái)實(shí)現“裝配式”建設。從標準化的節點(diǎn)單元,到標準化的整機柜,到標準化的微模塊數據中心,再到整個(gè)智算中心,就像樂(lè )高積木一樣,層層組裝,快速建設。
作為基礎設施,要求不同的智算中心能夠互聯(lián)互通。包括管理上的互操作,統一的調度分發(fā)、監控運維;業(yè)務(wù)上的互連接,包括網(wǎng)絡(luò )打通、業(yè)務(wù)遷移等;數據上的互流通,實(shí)現容災、數據共享等。
基礎設施的超大規模要求智算中心應該是集約高效的。首先,智算中心要整體設計,理念先進(jìn)。技術(shù)上,融合架構代表著(zhù)數據中心體系結構的未來(lái)發(fā)展方向。融合架構從1.0到2.0,已經(jīng)實(shí)現了存儲資源和異構計算資源的彈性組合?,F在的融合架構,正處于3.0階段,也就是通過(guò)連接、池化和重構的技術(shù),實(shí)現不同計算資源的協(xié)同能力,通過(guò)軟件定義實(shí)現業(yè)務(wù)自動(dòng)感知和資源自動(dòng)重構,使計算的性能和效率大幅度地提升。
硬件層面,通過(guò)硬件重構實(shí)現資源池化。CPU與GPU、FPGA、xPU等各種加速器將更加緊密結合,利用全互聯(lián)NVSwitch、CXL、Open CAPI等新型超高速內外部互連技術(shù),實(shí)現異構計算芯片的融合;CPU之間可以通過(guò)池化融合的方式實(shí)現靈活組合,可以根據業(yè)務(wù)場(chǎng)景動(dòng)態(tài)形成1路到多路多種計算單元;異構存儲介質(zhì),如NVMe,SSD,HDD等則通過(guò)高速互連形成存儲資源池。
在計算和存儲資源池中,除了傳統CPU、GPU等,還可以應用更多新型計算芯片、存儲介質(zhì)和互連技術(shù),進(jìn)一步提升數據中心的處理能力。
例如,谷歌專(zhuān)為人工智能設計的芯片TPU。與GPU相比,TPU采用低精度(8位)計算,以降低每步操作使用的晶體管數量,是同代CPU或者GPU速度的15~30倍。同時(shí),TPU還可以進(jìn)行池化,實(shí)現了TPU之間的高速互聯(lián),也就是TPUPOD,并對外提供TPU算力服務(wù)。
存儲方面,非易失內存DCPMM,既可以作為高速硬盤(pán)使用,也可以作為標準的內存使用,當作為內存使用時(shí),其單條內存容量最大可以到512GB,使得推理作業(yè)密度提升一倍,每單位作業(yè)成本下降近50%。
互連方面,異構芯片高速互連的技術(shù)CXL、open CAPI等,實(shí)現了CPU和設備、設備和設備之間的內存共享,構建高效池化的智算中心從理想照進(jìn)了現實(shí)。
軟件層面,則通過(guò)軟件定義,在可重構的硬件資源池基礎上,通過(guò)靈活的組織,將不同的資源池組成專(zhuān)業(yè)的服務(wù)器、存儲、網(wǎng)絡(luò )系統,并實(shí)現資源的高效管理和調度以及數據在池化資源的靈動(dòng)流轉。當AI與軟件定義結合后,賦予了軟件定義更高級的含義。從業(yè)務(wù)上,實(shí)現了基于業(yè)務(wù)特征感知的智能資源調度,讓合適的資源在合適的位置去執行合適的任務(wù),就像我們說(shuō)的讓合適的人去干合適的事一樣。從管理上,實(shí)現了智能化的運維,也就是智算中心的無(wú)人巡檢、故障自愈等。
軟件定義一個(gè)典型的趨勢是軟硬件協(xié)同設計,由專(zhuān)用芯片、FPGA處理更多的業(yè)務(wù)負載,由軟件進(jìn)行更智能化的管理和調度。例如,基于FPGA和NVMe組成資源池,以硬件輔助虛擬化的方式為虛擬機實(shí)例提供接近硬件性能的計算、存儲、網(wǎng)絡(luò )功能,性能損失從傳統軟件模擬方式的50%降低到1%左右,相同條件下可以百倍加速AI作業(yè)效率。
綠色節能是永恒的話(huà)題,從傳統的節點(diǎn)內風(fēng)冷,到機柜級冷板式液冷,再到數據中心的浸沒(méi)式液冷整體設計,配合余熱回收、相變儲能等循環(huán)節能技術(shù),可以實(shí)現PUE接近于1的目標,打造高效清潔的綠色智算中心。
智算中心作為基礎設施,要服務(wù)大眾,提供算力服務(wù)、數據服務(wù)和智能服務(wù),支撐智慧城市、智能制造、智能家居以及智能醫療等行業(yè)的智慧化轉型。
但是行業(yè)用戶(hù)的智慧轉型,仍然存在著(zhù)一個(gè)巨大的技術(shù)鴻溝,這個(gè)鴻溝里,有如何選擇最合適的算法模型,有如何從軟、硬件兩方面對算法做性能優(yōu)化,有如何對面向特定領(lǐng)域的智能算法進(jìn)行高效敏捷的開(kāi)發(fā)部署等諸多問(wèn)題。要填補這些鴻溝,需要智算中心提供整合的、易用的開(kāi)放服務(wù)平臺。
基于智算中心先進(jìn)的AI算力基礎平臺、AI算力調度平臺、AI算法模型來(lái)打造人工智能開(kāi)放服務(wù)平臺,匯聚并賦能行業(yè)AI應用的開(kāi)發(fā)者,加速開(kāi)發(fā)各種各樣的行業(yè)智慧應用,加速行業(yè)AI化、加速產(chǎn)業(yè)AI化。
所以智算中心,不管你看得見(jiàn)或者看不見(jiàn),它就在那里,源源不斷產(chǎn)生智慧時(shí)代的動(dòng)力:計算力。智算中心,就是我們這個(gè)時(shí)代的動(dòng)力源。
新基建為企業(yè)帶來(lái)了巨大的發(fā)展機遇,抓住機會(huì )就會(huì )發(fā)展壯大,喪失機會(huì )就可能被淘汰出局。智算中心作為未來(lái)的動(dòng)力源,是我們贏(yíng)得未來(lái)的關(guān)鍵,讓我們攜手共進(jìn),共同面對疫情給全球帶來(lái)的挑戰,早日恢復經(jīng)濟的快速發(fā)展。
來(lái)源:《光明日報》