近日,AI與未來(lái)網(wǎng)絡(luò )研究院賈維嘉教授團隊在設備端邊緣智能方向的工作“Empowering Edge Intelligence: A Comprehensive Survey on On-Device Al Models”被計算機領(lǐng)域頂刊ACM Computing Surveys錄用。
ACM Computing Surveys 1969年創(chuàng )刊,最新影響因子23.8,目前是Cite Score上排名第一的計算機領(lǐng)域國際頂級期刊,屬于中科院SCI一區Top期刊。
設備端人工智能(AI)模型
2025.3
在當前人工智能技術(shù)迅猛發(fā)展的背景下,設備端人工智能(AI)模型的研究逐漸成為推動(dòng)智能設備普及和應用的重要力量。
綜述深入探討了設備端人工智能模型的基本概念、應用場(chǎng)景及其面臨的技術(shù)挑戰。首先,論文定義了設備端AI模型的特征,包括實(shí)時(shí)性能、資源限制和數據隱私保護,并分析了其在智能手機、智能家居、自動(dòng)駕駛和醫療設備等領(lǐng)域的應用。其次,綜述詳細討論了設備端AI模型所面臨的主要挑戰,如計算資源的限制、能量管理和數據隱私問(wèn)題。為應對這些挑戰,研究者們提出了多種優(yōu)化和實(shí)施策略,包括模型壓縮、數據預處理和系統集成等。此外,綜述還探討了邊緣計算和基礎模型等新興技術(shù)對設備端AI模型演變的影響,強調了這些技術(shù)在推動(dòng)智能系統發(fā)展的重要性。
綜述從數據、模型和系統三個(gè)方面詳細介紹了在設備上優(yōu)化和實(shí)施人工智能模型的方法。設備端人工智能的數據優(yōu)化方法能夠有效提升為設備端AI模型收集的數據質(zhì)量;模型優(yōu)化操作包括模型壓縮和模型設計,其中模型壓縮通過(guò)剪枝、模型量化和知識蒸餾等技術(shù)減少模型大小,以獲得在保持高準確度的同時(shí)需要更少資源的緊湊模型;綜述還介紹了加速模型性能的硬件方法。
本綜述為設備端AI模型的特征和應用提供了系統的分析框架,提出的優(yōu)化策略為設備端AI模型的實(shí)際應用提供了指導,強調了設備端AI模型在智能家居、醫療健康、工業(yè)自動(dòng)化等多個(gè)領(lǐng)域的應用潛力。
本文第一作者為AI與未來(lái)網(wǎng)絡(luò )研究院2022級博士研究生王旭斌,指導老師賈維嘉教授。合作者還有北京師范大學(xué)王田教授、郭劍雄副教授、王晨豪副教授、唐志清博士以及UIC孟天暉博士。
這項工作得到了國家自然科學(xué)基金、廣東省教育廳、廣東省科技廳、北京師范大學(xué)珠海校區、珠海市科學(xué)技術(shù)創(chuàng )新局的資助。部分工作得到了北京師范大學(xué)(珠海)交叉智能超算中心的支持。
鏈接:https://arxiv.org/pdf/2503.06027
來(lái)源:BNU自然科學(xué)高等研究院