1 目標和概述
當前邊緣計算設備普遍強通訊弱計算,其算力通常有限。隨著(zhù)云計算、人工智能等技術(shù)的興起和廣泛應用,邊緣計算在應對更多聯(lián)接、更高實(shí)時(shí)性要求、海量異構數據處理上,對邊緣算力需求也顯著(zhù)增長(cháng);同時(shí)邊緣計算因為其部署條件限制,對服務(wù)器在環(huán)境適配性、部署運維上有更嚴苛要求;面對海量邊緣應用場(chǎng)景,作為軟件基礎平臺的操作系統尤為重要,向下要能充分發(fā)揮硬件算力,向上能使能海量應用。
基于上述挑戰,鯤鵬軟硬協(xié)同邊緣計算平臺, 從處理器、服務(wù)器和操作系統三個(gè)層面,打造適用于邊緣計算的融合統一計算平臺,為邊緣計算在智能園區、電力能源、工業(yè)制造和游戲直播等多個(gè)行業(yè)發(fā)展提供動(dòng)能。
2 解決方案介紹
鯤鵬軟硬協(xié)同邊緣計算平臺,主要包含鯤鵬920 處理器、TaiShan200邊緣型服務(wù)器(型號2280E)和openEuler服務(wù)器操作系統三個(gè)方面。
2.1 鯤鵬920高性能處理器
鯤鵬920高性能處理器具備高性能、高吞吐、高集成和高能效的特點(diǎn),為邊緣計算應用場(chǎng)景提供充足算力。
圖1 鯤鵬920處理器:多核架構提供高性能、高并發(fā)算力
(1)高性能:鯤鵬920集成了64核,主頻提升至2.6GHz,并通過(guò)優(yōu)化分支預測算法、提升運算單元數量、改進(jìn)內存子系統架構等一系列微架構設計,大幅提高了處理器核性能。
(2)高吞吐:為改善在低延時(shí)條件下高并發(fā)的能力, 鯤鵬920采取了三項措施。首先將業(yè)界DDR通道數量從6通道增加到8通道,速率從2666MHz提升至2933MHz,總帶寬達到1.5T比特每秒,超出業(yè)界主流內存帶寬46%;其次將PCIe從3.0升級到4.0,速率翻番,帶寬達到640Gbps,比業(yè)界主流提升66%;最后將網(wǎng)口帶寬從25G直接提升到100G,帶寬翻了4倍。
(3)高集成:傳統服務(wù)器架構上,CPU/南橋/網(wǎng)卡/硬盤(pán)控制器是系統標配,需要4顆芯片來(lái)實(shí)現;隨著(zhù)workload的豐富多樣、異構計算的不斷興起,在服務(wù)器層面需要更多的槽位來(lái)部署不同的業(yè)務(wù)加速部件,而槽位在服務(wù)器上是一個(gè)緊缺資源。鯤鵬920不僅是一顆通用CPU,還同時(shí)集成了南橋、網(wǎng)卡、SAS存儲控制器 等三種芯片的功能,做到業(yè)界領(lǐng)先的集成度,單顆芯片實(shí)現4顆芯片的功能,從而釋放出更多槽位,擴展更多功能,大幅提高系統的集成度并為客戶(hù)帶來(lái)總體擁有成本上的收益。
(4)高能效:伴隨云計算、邊緣計算的興起,使得數據中心規模越來(lái)越大,從幾臺服務(wù)器、幾個(gè)機架演變成以萬(wàn)臺服務(wù)器為單位的數據中心集群,占地空間和能源消耗成為大型數據中心的重要影響因素,節能具有更重要的意義。正因每個(gè)機架的供電能力是有限的,每個(gè)機架的計算能力越強,在大規模數據中心建設時(shí)越能有效減少總體占地和減少功耗?;邛H鵬920,在大規模數據中心業(yè)務(wù)實(shí)踐中,每萬(wàn)臺服務(wù)器可每年省電1000 萬(wàn)度、碳排放每年減少1萬(wàn)噸。
2.2 TaiShan 200邊緣型服務(wù)器(型號2280E)
TaiShan 200邊緣型服務(wù)器(型號2280E)專(zhuān)為邊緣計算應用場(chǎng)景設計,采用鯤鵬920處理器以提供充足邊緣算力。
(1)端邊云協(xié)同計算:鯤鵬處理器兼容ARM架 構,提供強大多核算力;具有ARM原生指令集優(yōu)勢,提供更加高效的應用開(kāi)發(fā)和部署運行環(huán)境,使能端邊云算力同構;
(2)多樣性計算:基于鯤鵬+昇騰芯片族構筑多樣性計算能力,滿(mǎn)足邊緣場(chǎng)景差異化算力需求;
(3) 易部署、易運維:機框采用短機箱設計,存儲、網(wǎng)絡(luò )和風(fēng)扇等部件采用模塊化設計,系統具有-5°C 至55°C的超寬環(huán)溫適應性,滿(mǎn)足邊緣場(chǎng)景嚴苛的部署要求。
圖2 TaiShan 200服務(wù)器
2.3 openEuler服務(wù)器操作系統
openEuler服務(wù)器操作系統是基于鯤鵬處理器的服務(wù)器配套軟件基礎設施,在多核調度、軟硬協(xié)同、指令級優(yōu)化等多方面深度優(yōu)化,能最大釋放鯤鵬強大算力, 是鯤鵬計算產(chǎn)業(yè)中的基礎軟件重要組成部分。
openEuler基于Linux內核的開(kāi)源操作系統,支持x86和ARM等多種處理器架構,適用于數據庫、大數據、云計算、人工智能及邊緣計算等場(chǎng)景。
圖 3 openEuler
openEuler也是一個(gè)開(kāi)源的、免費的Linux發(fā)行版平臺,致力于通過(guò)開(kāi)放的社區形式,與全球的開(kāi)發(fā)者共同構建一個(gè)開(kāi)放、多元和架構包容的軟件生態(tài)體系。
作為一款通用操作系統, openEuler除了具備當前流行的操作系統的特點(diǎn)之外,同時(shí)又有自身的不同點(diǎn),尤其與鯤鵬硬件配套,實(shí)現大量的優(yōu)化與創(chuàng )新,具有以下五方面特點(diǎn):
(1)領(lǐng)先的多核調度技術(shù):從多核向眾核發(fā)展過(guò)程中,openEuler提供的自上而下的NUMA aware方案,提升調度性能。同時(shí)免鎖優(yōu)化, 并發(fā)增強等使系統整體性能得到明顯提升;
(2) 軟硬協(xié)同,釋放強勁算力:通過(guò)KAE(Kunpeng Accelerator Engine)庫,充分釋放鯤鵬硬件算力潛能,提升算力表現。同時(shí)通過(guò)openssl相結合,在業(yè)務(wù)零修改情況下,從CPU把加解密算力缷載到硬件加解密卡上, 降底CPU負載;
(3) 軟量級虛擬化:采用iSula和StatioVirt虛擬化技術(shù)及容器技術(shù),提供從云到邊緣的安全、靈活業(yè)務(wù)部署及編排能力,應對復雜的業(yè)務(wù)場(chǎng)景;
(4)指令級優(yōu)化:對于業(yè)界主流的動(dòng)態(tài)、靜態(tài)語(yǔ)言從指令級進(jìn)行優(yōu)化,充分利用處理器流水線(xiàn),提升運行性能;
(5)A-tune智能優(yōu)化引擎:動(dòng)態(tài)智能識別操作系業(yè)務(wù)場(chǎng)景,匹配場(chǎng)景參數模型,使系統處在最佳運行狀態(tài),從而提升業(yè)務(wù)性能。
3 代表性及推廣價(jià)值
鯤鵬軟硬協(xié)同邊緣計算平臺,目前已廣泛部署和應用于交通、電力、電信、互聯(lián)網(wǎng)等多個(gè)國計民生行業(yè), 為豐富邊緣計算的應用和更多業(yè)務(wù)創(chuàng )新提供充足算力。
(1)全國高速公路取消省界收費站項目應用
全國高速公路取消省界收費站項目中,截止目前部署了超過(guò)4000臺基于鯤鵬服務(wù)器主板的服務(wù)器,其中80%部署在邊緣場(chǎng)景,為系統提供高速、高效且穩定的算力。部署整體解決方案后,客車(chē)通行速度從15秒降低到2秒,貨車(chē)通行速度從29秒降低為3秒,大大提高了通行效率。
同時(shí)依托數字平臺能力,構筑云邊協(xié)同、實(shí)時(shí)精準收費稽查大數據云平臺。通過(guò)ETC門(mén)架系統邊緣計算節點(diǎn)對車(chē)牌識別圖片、RSU(路側單元)讀取的車(chē)輛信息進(jìn)行實(shí)時(shí)分析比對,異常信息實(shí)時(shí)上報省中心并同步至相關(guān)出入口收費站進(jìn)行實(shí)時(shí)管控,通過(guò)“省中心-ETC門(mén)架”云邊協(xié)同,實(shí)現實(shí)時(shí)、精準收費稽查。
(2)電力系統邊緣變電站監控應用
在某電網(wǎng)項目中,已建成基于鯤鵬的電網(wǎng)云平臺和數據中臺,滿(mǎn)足了電力物聯(lián)網(wǎng)對數字平臺的支撐需求,確保資源調配更彈性靈活、服務(wù)集成更統一高效、數據資源更集約共享。電網(wǎng)云和數據中臺利用現有平臺基礎開(kāi)展建設,云平臺減少近50%的技術(shù)組件運維成本,資源利用率提升近2倍,實(shí)現了數據“可提取、可流轉、可匯集、可分析、可應用”,可快速響應客戶(hù)需求,為各種業(yè)務(wù)系統提供靈活豐富的網(wǎng)絡(luò )、計算和存儲環(huán)境。在各變電站所處的邊緣場(chǎng)景,通過(guò)部署鯤鵬+ openEuler軟硬協(xié)同邊緣計算平臺,實(shí)現對變電站各種運行數據的搜集、分析和自動(dòng)化處理,提升變電站運行維護效率,降低運行維護成本。
圖4 高速自由流:為智能交通提供算力支持
摘自《自動(dòng)化博覽》2021年2月刊