1 云邊端協(xié)同聯(lián)邦學(xué)習關(guān)鍵技術(shù)
近年來(lái),AI取得了巨大進(jìn)步,較新的AI算法與用于收集、存儲和處理大量數據的高成本效益和可擴展機制相結合已將我們帶入AI黃金時(shí)代。人們普遍預計AI將推動(dòng)許多大規模分布式領(lǐng)域的應用,例如自動(dòng)駕駛汽車(chē)、災難響應、精準農業(yè)等[1]。構建AI系統的主要范式是將AI任務(wù)集中在云,通過(guò)集中式單體計算在強大的計算平臺上訓練模型。然而在許多應用中,數據在終端設備生成和分發(fā),將它們轉移到中央服務(wù)器將違反隱私需求并受到傳輸限制。為了緩解這些問(wèn)題, 聯(lián)邦學(xué)習[2]作為一種有前途的分布式AI范式被提出,它在保護用戶(hù)隱私的同時(shí),在邊緣與海量設備協(xié)作訓練AI模型。
在聯(lián)邦學(xué)習中,設備用自己的私有數據訓練本地模型,將模型參數而不是原始數據提交給參數服務(wù)器。例如,在周期t時(shí),每個(gè)終端設備對模型參數ωi (t)進(jìn)行訓練,ηt表示梯度下降步長(cháng),Fi (·)為損失函數,得到式(1):
ωi (t)=ωi (t -1) -ηt?Fi (ωi (t -1)) (1)
在收集到足夠的參數后,參數服務(wù)器將全局模型聚合并分發(fā)給設備進(jìn)行下一輪本地訓練,如式(2)所示:
其中|D|=∑i |Di |為終端設備的數據量之和。以上過(guò)程不斷迭代,直到參數服務(wù)器通過(guò)最小化的全局損失函數F(w)達到收斂,該函數如式(3)所示:
憑借其創(chuàng )新的運營(yíng)理念,聯(lián)邦學(xué)習為多種應用場(chǎng)景落地提供益處。(1)數據隱私增強:隨著(zhù)通用數據保護條例[3]等數據隱私保護立法, 聯(lián)邦學(xué)習成為構建智能和安全系統的理想解決方案。參數服務(wù)器中的訓練不需要原始數據,因此將用戶(hù)敏感信息泄露給第三方的可能性降到最低。(2)低延遲網(wǎng)絡(luò )通信:由于不需要將數據傳輸到參數服務(wù)器,有助于減少數據卸載造成的通信延遲,同時(shí)也節省了頻譜、傳輸功率等網(wǎng)絡(luò )資源。(3)提高學(xué)習質(zhì)量:通過(guò)設備網(wǎng)絡(luò )中大量的計算和數據資源,聯(lián)邦學(xué)習有潛力提高整個(gè)訓練過(guò)程的收斂速度,并提高準確率,這可能無(wú)法通過(guò)使用數據不足和算力受限的集中式AI實(shí)現。反過(guò)來(lái),由于其分布式學(xué)習特性,聯(lián)邦學(xué)習也提高了智能網(wǎng)絡(luò )的可伸縮性。
圖1是從集中式單體計算,分布式網(wǎng)聯(lián)計算到云邊端未來(lái)泛在多層級計算的演變過(guò)程。大多數聯(lián)邦學(xué)習假設云作為參數服務(wù)器, 但隨著(zhù)邊緣計算[4] 的出現,基于邊緣的聯(lián)邦學(xué)習[5~6]逐漸受到關(guān)注,其中邊緣服務(wù)器作為參數服務(wù)器與終端設備協(xié)作訓練AI模型?;谠坪突谶吘壍穆?lián)邦學(xué)習都采用相同的訓練算法,但兩者具有基本的區別。在基于云的聯(lián)邦學(xué)習中,參與的終端設備可達數百萬(wàn)[7] ,提供AI所需的海量數據,但是通信速度慢且不可預測,使得訓練過(guò)程效率低下。相反,在基于邊緣的聯(lián)邦學(xué)習中,計算的延遲與通信的延遲相當,在計算和通信方面有著(zhù)更好的權衡,然而邊緣服務(wù)器可以訪(fǎng)問(wèn)的終端設備數量有限,導致了不可避免的訓練性能損失。因此,既要利用云訪(fǎng)問(wèn)大量訓練樣本,又要利用邊緣實(shí)現快速模型更新。這促使技術(shù)向著(zhù)異構、云邊端協(xié)同、全面泛在智能計算演進(jìn),云邊端協(xié)同的分層聯(lián)邦學(xué)習技術(shù)[8]就此提出, 且獲得了相對兩個(gè)技術(shù)的最佳效果。與基于云的聯(lián)邦學(xué)習相比,云邊端協(xié)同分層聯(lián)邦學(xué)習將顯著(zhù)減少與云的昂貴通信,并輔以高效的終端設備。邊緣更新,從而顯著(zhù)減少本地迭代的運行時(shí)間和數量。另一方面,由于云可以訪(fǎng)問(wèn)更多的數據,云邊端協(xié)同分層聯(lián)邦學(xué)習也在訓練中勝過(guò)基于邊緣的聯(lián)邦學(xué)習。相應地,在云邊端協(xié)同分層聯(lián)邦學(xué)習中本地終端設備模型訓練過(guò)程演化過(guò)程如式(4)所示:
其中|De |=∑i ∈De |Di |為邊緣服務(wù)器連接的終端設備數據量之和, τ和σ分別是邊緣服務(wù)器和云的聚合頻次 (σ|τ=0)。
圖1 從集中式單體計算,分布式網(wǎng)聯(lián)計算到云邊端未來(lái) 泛在多層級計算的演變
2 云邊端協(xié)同聯(lián)邦學(xué)習應用前景
目前云邊端協(xié)同在不同行業(yè)中都有應用需求,例如可以促進(jìn)智慧交通中信息互聯(lián)互通,幫助工業(yè)互聯(lián)網(wǎng)完成數字化升級和智能化轉型等。這些應用場(chǎng)景雖然解決了帶寬、能耗等問(wèn)題,但很少考慮隱私安全。因此,有必要引入云邊端協(xié)同聯(lián)邦學(xué)習技術(shù)促進(jìn)在嚴格保護隱私的前提下訓練出合適的AI模型。
2.1 “聯(lián)邦學(xué)習+智慧金融”打破數據壁壘, 成為 數字化轉型的關(guān)鍵
金融行業(yè)受到知識產(chǎn)權、隱私保護、數據安全等因素影響,數據無(wú)法被直接聚合進(jìn)行AI模型訓練。因此,借助聯(lián)邦學(xué)習來(lái)訓練模型成為此領(lǐng)域備受關(guān)注的技術(shù)手段。微眾銀行推出的FATE聯(lián)邦學(xué)習平臺[9], 平安科技推出的“蜂巢”聯(lián)邦學(xué)習平臺[10] ,螞蟻金服推出的共享AI平臺[11]都將聯(lián)邦學(xué)習應用于銀行、保險、信貸、風(fēng)控等金融領(lǐng)域,更好地挖掘了數據價(jià)值,實(shí)現多方共贏(yíng)的AI模型訓練。京東數字科技集團也推出了自主研發(fā)的聯(lián)邦學(xué)習平臺Fedlearn[12] ,在滿(mǎn)足數據隱私安全和監管要求的前提下,讓AI系統更加高效準確地共同使用各自數據。
2.2 “聯(lián)邦學(xué)習+智慧醫療”助力醫療健康智慧化,建設醫療健康新生態(tài)
目前AI技術(shù)已被廣泛用于醫療保健領(lǐng)域,但仍面臨暴露醫院/病人的私人和敏感信息、分享大量數據等 問(wèn)題。應用聯(lián)邦學(xué)習可以使模型計算在數據源處執行,在尊重個(gè)人隱私的前提下實(shí)現大規模的精準醫療。騰訊天衍實(shí)驗室結合微眾銀行將聯(lián)邦學(xué)習與醫療深度融合[13] ,通過(guò)搭建基于聯(lián)邦學(xué)習技術(shù)的大數據集中與挖掘平臺,打破了數據壁壘,保護了數據隱私,并成功落地疾病預測領(lǐng)域,腦卒中預測準確率達80%。同時(shí),英偉達推出了基于Clara的聯(lián)邦學(xué)習新產(chǎn)品[14], 將患者數據保存在醫療服務(wù)機構內部,并幫助醫生進(jìn)行準確高速的診斷。
2.3 “聯(lián)邦學(xué)習+智慧城市”推進(jìn)城市建設邁上新 臺階,提升總體水平和格局
AI技術(shù)也被用于智慧城市來(lái)提供智能屬性,但目前多數方案依賴(lài)于集中式學(xué)習架構,不能適應智能設備的快速擴展。應用聯(lián)邦學(xué)習可以提供更有吸引力的功能,使去中心化的智能城市應用具有高隱私和低通信延遲。2019年,微眾銀行與特斯聯(lián)結合聯(lián)邦學(xué)習和城市管理的業(yè)務(wù)經(jīng)驗成立了“AIoT聯(lián)合實(shí)驗室”,助力城市管理、社區等智能化升級[15]。京東城市以聯(lián)邦學(xué)習技術(shù)為本,基于城市計算和聯(lián)邦學(xué)習打造了產(chǎn)品“數字網(wǎng)關(guān)” [16] ,致力于解決城市中數據孤島、數據共享難的問(wèn)題,在不同機構間創(chuàng )建安全、共享、智能、高效的連接。
3 云邊端協(xié)同聯(lián)邦學(xué)習關(guān)鍵挑戰和未來(lái) 展望
3.1 隱私保護
云邊端聯(lián)邦學(xué)習雖然通過(guò)交換模型參數而不是原始數據來(lái)保護隱私數據,但在訓練過(guò)程中的模型通信也會(huì )將敏感信息泄露給第三方,例如模型的反向推導。雖然已有一些提高數據隱私性的方法,但這些方法都增加了計算復雜度和計算負擔。為了進(jìn)一步有效地保護數據安全,需要尋找新的方法來(lái)防止模型傳輸過(guò)程中信息泄露。事實(shí)上,由于網(wǎng)絡(luò )中各種設備的異構性,不同設備的隱私具有不同特點(diǎn)的限制,基于特定設備隱私限制,隱私保護方法的發(fā)展成為聯(lián)邦學(xué)習的一個(gè)有趣和持續的方向。
3.2 系統與數據異構
作為云邊端聯(lián)邦網(wǎng)絡(luò )一部分的設備,其存儲、計算和通信的能力彼此之間有很大的不同。這種差異背后的原因與硬件、網(wǎng)絡(luò )連接和電力供應有關(guān),并且由于連接或能源的限制,每個(gè)設備都有可能不可靠。為了避免系統的異構性,可以采用異步通信技術(shù),使迭代優(yōu)化算法并行以消除掉隊者。另一種方法是在每一輪中選擇積極參與的設備,以確保在一個(gè)預先定義的窗口內最大限度地聚集更新。第三種方法是當失敗的設備具有某些特定的數據特征時(shí),避免設備故障導致設備采樣方案的偏差。另外,算法冗余可以作為編碼計算技術(shù)被引入以實(shí)現容錯。
3.3 統計學(xué)異質(zhì)性
如前所述,各種設備根據設備的不同使用類(lèi)型,以非同分布的方式在網(wǎng)絡(luò )上收集數據。因此,數據可能會(huì )因底層結構而有很大的不同,這些底層結構捕捉到了設備之間的連接和它們的相關(guān)分布。數據生成的模式增加了在系統建模、分析和評估中出現掉隊者的機會(huì )。當從非同分布的數據中訓練模型時(shí),數據建模和訓練過(guò)程中的收斂行為分析方面都會(huì )出現問(wèn)題??梢钥紤]使用不同的指標對統計異質(zhì)性進(jìn)行量化,這些指標大多是在訓練階段計算的。此外,還需要研究如何改進(jìn)云邊端聯(lián)邦優(yōu)化方法中涉及的收斂技術(shù)。
3.4 通信成本
聯(lián)邦網(wǎng)絡(luò )可能由數百萬(wàn)遠程移動(dòng)終端設備組成,聯(lián)邦學(xué)習模型的訓練可能涉及大量交互,此外網(wǎng)絡(luò )中的通信速度無(wú)法保證,因此為了云邊端聯(lián)邦學(xué)習實(shí)用化,有必要開(kāi)發(fā)具有高通信效率的方法??梢钥紤]使用本地更新方法,允許每個(gè)通信輪中在設備上并行實(shí)現可變數量的本地更新。這將有助于減少通信的次數。其次,模型壓縮機制(即稀疏化、子采樣和量化)也有助于減少每次更新時(shí)通信的消息大小。第三,在運行低帶寬和高延遲網(wǎng)絡(luò )時(shí),分布式拓撲可以作為瓶頸實(shí)例的替代解決方案。
3.5 激勵機制
聯(lián)邦學(xué)習會(huì )消耗參與者的大量資源,如計算、帶寬資源等,還會(huì )遭受隱私泄露的威脅,因此如果沒(méi)有足夠的獎勵,這些因素將阻礙設備參與聯(lián)邦學(xué)習。同時(shí),如果沒(méi)有足夠的訓練數據、帶寬和算力,訓練性能將會(huì )迅速下降。因此,有必要建立合理的激勵機制來(lái)激勵更多的設備參與,貢獻高質(zhì)量的數據和充足的資源。未來(lái)激勵機制首先應以低成本提高學(xué)習性能為目標來(lái)激勵更多的參與者加入學(xué)習。其次,應該更加重視面向企業(yè)數據的云邊端聯(lián)邦學(xué)習,企業(yè)的決策行為與普通設備截然不同,這就需要采取全新的激勵方法。此外,未來(lái)應多關(guān)注多維度指標的綜合的激勵機制,以實(shí)現多目標和多功能。
3.6 實(shí)例:面向云邊端協(xié)同聯(lián)邦學(xué)習的激勵機制
在云邊端架構中,設計的激勵可能有不同的形式,可以采用博弈理論、拍賣(mài)理論等多種方式來(lái)實(shí)現。例如,利用博弈論為云邊端協(xié)同聯(lián)邦學(xué)習設計了激勵機制,云和邊緣服務(wù)器將通過(guò)選擇不同的支付方式來(lái)激勵終端設備參與訓練任務(wù)。具體地,云宣布獎勵作為對邊緣服務(wù)器和終端設備的激勵,以最大限度地提高模型的準確性,而邊緣服務(wù)器充當云和終端設備之間的媒介。理性的終端設備、邊緣和云都最大化其自身效用,分別決策貢獻數據量x_i、給所連接設備的獎勵R_l和單位數據量的獎勵P如式(5)~(7)所示:
其中,p_i,q_i,θ_i分別是設備i分配的獎勵比例、多維貢獻和類(lèi)型,c_i (·)是相應的成本函數,E(·)和U(·)分別為邊緣和云的收益函數。通過(guò)將云邊端協(xié)同的層次結構映射到由效用函數相互關(guān)聯(lián)的子對策中,充分把握了協(xié)同架構中各個(gè)參與者之間的內在利益關(guān)系,揭示了利益相關(guān)者對數據資源分配的依賴(lài)關(guān)系,最大化了個(gè)人效用。這種基于激勵的模型參數共享過(guò)程將持續下去直到收斂,并達到了用低成本換取高性能的效果。如圖2所示。
圖2 面向云邊端協(xié)同聯(lián)邦學(xué)習的激勵機制
4 總結
隨著(zhù)大數據和AI的發(fā)展,計算形式完成了從集中式單體計算到分布式網(wǎng)聯(lián)計算的躍遷,并正在朝著(zhù)異構、協(xié)同、全面泛在智能計算演進(jìn)。云邊端協(xié)同聯(lián)邦學(xué)習作為一種新興的技術(shù)方法,引發(fā)了學(xué)術(shù)界和產(chǎn)業(yè)界的極大關(guān)注。因此,本文介紹了近年來(lái)聯(lián)邦學(xué)習技術(shù)的發(fā)展,說(shuō)明了其在云邊端協(xié)同領(lǐng)域的典型應用,強調了一些克服其應用的關(guān)鍵挑戰并展望了一些有趣的發(fā)展方向??偟膩?lái)說(shuō),面向未來(lái)泛在智能的云邊端協(xié)同聯(lián)邦學(xué)習將會(huì )廣泛應用于各行各業(yè),不斷地、深刻地改變人們的生產(chǎn)生活。例如近來(lái)熱度高、將有機會(huì )改變互聯(lián)網(wǎng)形態(tài)的元宇宙,云邊端協(xié)同聯(lián)邦學(xué)習可以為其提供無(wú)限滋長(cháng)的技術(shù)土壤,成為元宇宙最重要的基礎設施之一,并對元宇宙的最終形態(tài)和融合起到?jīng)Q定性作用。
作者簡(jiǎn)介:
趙云鳳(1997-),女,河北人,現就讀于天津大學(xué)智 能與計算學(xué)部,研究方向為邊緣計算、分布式機器學(xué) 習和博弈論等。 王曉飛(1982-),男,河北人,教授,現就職于天 津大學(xué)智能與計算學(xué)部,主要研究方向是邊緣智能理 論、邊緣計算系統架構、云邊協(xié)同算法等。
仇 超(1988-),女,河北人,博士,現就職于天津 大學(xué)智能與計算學(xué)部,研究方向為邊緣網(wǎng)絡(luò )人工智能 資源優(yōu)化及區塊鏈共識算法。 劉志成(1992-),男,安徽人,現就讀于天津大學(xué)智 能與計算學(xué)部,研究方向為邊緣計算、多智能體學(xué)習 和博弈論等。 譚靖超(1994-),男,天津人,現就讀于天津大學(xué)智 能與計算學(xué)部,研究方向為邊緣計算、5G移動(dòng)邊緣網(wǎng) 絡(luò )和云邊端網(wǎng)絡(luò )架構等。 鄧 輝(1982-),男,河北人,現就讀于天津大學(xué)智 能與計算學(xué)部,研究方向為邊緣計算、算力網(wǎng)絡(luò )、數 字城市和邊云超網(wǎng)絡(luò )架構等。
參考文獻:
[1] Goodfellow I, Bengio Y, Courville A. Deep Learning[M]. The MIT Press, 2016.
[2] Mcmahan H B, Moore E, D Ramage, et al. Communication-Efficient Learning of Deep Networks from DecentralizedData[J]. 2016.
[3] Goddard, Michelle. The EU General Data Protection Regulation (GDPR): European regulation that has a globalimpact[J]. International Journal of Market Research, 2017, 59 (6) : 703.
[4] Mao Y, You C, Zhang J, et al. A Survey on Mobile Edge Computing: The Communication Perspective[J]. IEEECommunications Surveys & Tutorials, 2017, (99) : 1.
[5] Wang S, Tuor T, Salonidis T, et al. Adaptive Federated Learning in Resource Constrained Edge Computing Systems[J].IEEE Journal on Selected Areas in Communications, 2019 : 1.
[6] Tran N H, Bao W, Zomaya A, et al. Federated Learning over Wireless Networks: Optimization Model Design andAnalysis[C]. IEEE INFOCOM 2019 - IEEE Conference on Computer Communications, 2019.
[7] Bonawitz K, Eichner H, Grieskamp W, et al. Towards Federated Learning at Scale: System Design[J]. 2019.
[8] Liu L, Zhang J, Song S H, et al. Client-Edge-Cloud Hierarchical Federated Learning[C]. ICC 2020 - 2020 IEEEInternational Conference on Communications (ICC), 2020.
[9] 微眾銀行開(kāi)源 FATE[EB/OL]. (2019-02-01) [2021-10-30].
[10] 平安科技"蜂巢"聯(lián)邦智能平臺入選2020網(wǎng)絡(luò )技術(shù)應用試點(diǎn)示范名單[EB/OL]. (2020-12-04) [2021-10-30].
[11] 螞蟻金服發(fā)布隱私保護白皮書(shū)[EB/OL]. (2018-08-23) [2021-10-30].
[12] 京東數科推出自研聯(lián)邦學(xué)習平臺Fedlearn, 助力數據安全保護并大幅提升學(xué)習效率[EB/OL]. (2020-10-12) [2021-10-30].
[13] 騰訊天衍實(shí)驗室聯(lián)合微眾銀行研發(fā)醫療聯(lián)邦學(xué)習 AI利器讓腦卒中預測準確率達80%[EB/OL]. (2020-04-14) [2021-10-30].
[14] NVIDIA Clara推聯(lián)邦學(xué)習, 保護患者數據[EB/OL]. (2019-12-04) [2021-10-30].
[15] 微眾銀行與特斯聯(lián)成立AIoT聯(lián)合實(shí)驗室, 助力智慧安防多場(chǎng)景智能化升級[EB/OL]. (2019-12-25) [2021-10-30].
[16] 微眾、騰訊、華為、京東、平安、VMware頭部企業(yè)云集, 聚焦AI聯(lián)邦學(xué)習最新應用落地[EB/OL]. (2019-11-04)[2021-10-30]
摘自《自動(dòng)化博覽》2022年2月刊