生成式AI大模型并未改變,人工智能在工業(yè)領(lǐng)域應用的范式
以ChatGPT、Llama等為代表的大模型技術(shù)拉開(kāi)了邁向通用人工智能的序幕,人工智能成為全球經(jīng)濟增長(cháng)的重要驅動(dòng)力(2.720, -0.04, -1.45%),對各類(lèi)產(chǎn)業(yè)的智能化帶來(lái)全新的空間。根據普華永道的預測,到2030 年,人工智能可為全球經(jīng)濟貢獻高達 15.7 萬(wàn)億美元,超過(guò)中國和印度目前的產(chǎn)出總和。其中,6.6 萬(wàn)億美元可能來(lái)自生產(chǎn)率的提高,9.1 萬(wàn)億美元可能來(lái)自消費端的影響。對于制造業(yè),人工智能一直是智能制造、工業(yè)4.0、工業(yè)互聯(lián)網(wǎng)等領(lǐng)域的重要部分,在ChatGPT、Stable Diffusion等崛起前,質(zhì)量檢測、設備預測性維護等代表性的人工智能應用已經(jīng)深度融入制造業(yè),并且形成成熟的應用范式。
工業(yè)人工智能的應用范式已經(jīng)成型 ,一是需要深度學(xué)習、強化學(xué)習等數據科學(xué)算法,計算機視覺(jué)、自然語(yǔ)言處理、語(yǔ)音識別等面向領(lǐng)域的算法,知識圖譜、專(zhuān)家系統等知識工程,例如通過(guò)計算機視覺(jué)來(lái)構建產(chǎn)品外觀(guān)檢測的模型,基于強化學(xué)習進(jìn)行排產(chǎn)規劃模型的構建,借助知識圖譜構建設備運維服務(wù)。二是需要通用支撐技術(shù)保障人工智能應用在制造業(yè)的部署和推理,例如邊緣計算、高性能計算等技術(shù)保障現場(chǎng)的推理速度,時(shí)序數據庫、大數據平臺等保障數據的有效管理和接入。三是需要工業(yè)領(lǐng)域知識及經(jīng)驗實(shí)現人工智能應用與工業(yè)場(chǎng)景的適配,例如在模型訓練的時(shí)候需要專(zhuān)家經(jīng)驗的介入實(shí)現調優(yōu)和優(yōu)化,在部分場(chǎng)景下需要機理模型和人工智能模型的結合才能發(fā)揮作用,在生產(chǎn)現場(chǎng)模型的部署和實(shí)施也需要和自動(dòng)化的設備、工業(yè)軟件等進(jìn)行集成。
大模型的崛起并沒(méi)有對人工智能在制造業(yè)的應用范式引起根本性的變革,但是在不同的環(huán)節增添了特定的需求,例如在算法層面,基于Transformer、U-Net 等架構的基礎模型成為生成式人工智能進(jìn)入制造領(lǐng)域的基礎;在通用支撐技術(shù)領(lǐng)域,向量數據庫、MaaS等也成為重要的數字基礎設施;在工業(yè)知識及經(jīng)驗領(lǐng)域,不同以往對時(shí)間序列等結構化數據的需求,生成式AI對高質(zhì)量文本、圖片、文檔等數據的要求不斷提升。雖然大模型仍在原有的范式下進(jìn)行應用,但是大模型技術(shù)會(huì )不斷的拓展人工智能在工業(yè)領(lǐng)域應用的空間,根據埃森哲測算,Al可以在2035年將制造業(yè)的附加值提高近4萬(wàn)億美元,根據Marketresearch預測,到 2032年,全球生成式人工智能制造市場(chǎng)規模將達到63.98億美元。
生成式AI大模型短期趨勢:拓展新場(chǎng)景并未出現替代小模型
生成式AI大模型能力覆蓋結構化數據、文本、圖像、音視頻等多個(gè)領(lǐng)域生成,但在制造業(yè)領(lǐng)域的探索仍聚焦于結構化數據、自然語(yǔ)言和圖像數據的處理和生成。這種情況的形成主要是目前尚未出現能力較強的音頻、視頻領(lǐng)域的基礎模型,所以尚未出現小模型領(lǐng)域像基于聲紋分析的設備診斷、基于視頻分析的安全生產(chǎn)等相關(guān)的工業(yè)案例。生成式AI探索也覆蓋了制造業(yè)的研發(fā)設計與規劃、生產(chǎn)過(guò)程管控、經(jīng)營(yíng)管理優(yōu)化、產(chǎn)品服務(wù)優(yōu)化等全生命周期。
在研發(fā)設計與規劃階段, 一方面是利用自然語(yǔ)言的交互能力實(shí)現CAD軟件功能的拓展,例如Back2CAD 基于Elaine CAD Bot、ChatGPT 和 Amazon AWS等的支持推出CADGPT?,支持智能推薦、文檔生成、代碼生產(chǎn)等各類(lèi)功能。另一方面是基于圖像數據的生成能力提升設計效率,例如海爾設計基于亞馬遜云科技和合作伙伴 Nolibox 攜手打造的 AIGC 解決方案,將AIGC 圖像生成能力引入到產(chǎn)品設計、UI 設計、CMF 設計、品牌設計等環(huán)節,涵蓋了新品設計、改款升級、渠道定制化等工業(yè)設計的業(yè)務(wù)場(chǎng)景。
在生產(chǎn)制造環(huán)節, 圍繞知識問(wèn)答和代碼生成等能力成為重要的探索熱點(diǎn)。例如西門(mén)子和微軟還在合作開(kāi)發(fā)可編程邏輯控制器 (PLC) 的代碼生成工具,ChatGPT 被用于通過(guò)自然語(yǔ)言輸入生成 PLC 代碼。Authentise通過(guò)利用12,000 篇科學(xué)增材制造論文對通用大語(yǔ)言模型的精調,推出 3DGPT用于增材制造技術(shù)問(wèn)答。用戶(hù)可以獲得例如“在使用粉末不銹鋼時(shí)如何減少缺陷的可能性”等專(zhuān)業(yè)問(wèn)題答案。例如創(chuàng )新奇智推出AInno-15B工業(yè)大模型,通過(guò)大模型服務(wù)引擎支撐生成式AI應用,實(shí)現工業(yè)機器人(11.460, -0.29, -2.47%)控制、企業(yè)私域數據分析、企業(yè)私域知識庫等應用。SprutCAM X結合ChatGPT api 構建CAM虛擬助手,能夠支持工程師操作機床加工,例如提出在點(diǎn)(100, 25)處鉆一個(gè)直徑10毫米的孔”,AI助手就會(huì )為生成相應的CAM執行代碼。C3iot 也是基于大語(yǔ)言模型構建了面向多個(gè)行業(yè)和多個(gè)領(lǐng)域的生成式AI 服務(wù),并且為某大型制造企業(yè)基于生成式AI提供設備運維服務(wù),借助 C3 Generative AI,操作員可以利用簡(jiǎn)化的工作流程來(lái)診斷設備故障根因。當操作員發(fā)現生產(chǎn)問(wèn)題時(shí),可以直接進(jìn)入 C3 Generative AI 搜索故障排除指南和教科書(shū),以找出潛在原因。
在經(jīng)營(yíng)管理環(huán)節, 基于大語(yǔ)言模型新增智能問(wèn)答、數據分析等能力成為主流。例如在ERP領(lǐng)域,用友以ChatGPT、文心一言、Llama等大模型為底座構建yongpt,在大模型的基礎架構當中,把確定性的事項交回用友BIP原有的產(chǎn)品功能去做,把不確定的事項、推理性的事項和人腦思維意識派定的事項交給大模型去開(kāi)發(fā),能夠支撐企業(yè)經(jīng)營(yíng)洞察、智能訂單生成、供應商風(fēng)控、動(dòng)態(tài)庫存優(yōu)化等應用。在CRM 領(lǐng)域,Salesforce、微軟等均加強生成式AI在產(chǎn)品中的集成和應用。
在產(chǎn)品服務(wù)優(yōu)化環(huán)節, 將大模型的能力集成到產(chǎn)品中,成為消費電子、汽車(chē)等領(lǐng)域產(chǎn)品智能化能力提升的探索焦點(diǎn)。例如國光電器(16.010, 0.43, 2.76%)推出的智能音箱Vifa ChatMini 內置了ChatGPT和 文心一言雙模型,在保持了專(zhuān)業(yè)聲學(xué)標準的基礎上,與傳統的智能音箱相比,Vifa ChatMini 在自然語(yǔ)言生成和情感表達方面具有顯著(zhù)的優(yōu)勢,可應用到老年人和兒童等特定用戶(hù)群體,用于情感支持和智能學(xué)習陪伴,也可作為智能助手應用在日常工作和規劃中。
綜上,目前生成式AI大模型在制造業(yè)的探索路徑初步呈現為三條路徑:
一是通過(guò)直接集成基礎大模型的問(wèn)答、代碼生成等通用能力來(lái)提升效率。例如海爾、西門(mén)子等的CAD、PLC代碼生成;Salesforce、微軟、ABB、用友等在CRM、ERP、生產(chǎn)管理等軟件接入大模型,提升專(zhuān)業(yè)軟件的數據分析、文檔管理、知識問(wèn)答等輔助能力。
二是通過(guò)微調、外掛知識庫等方式來(lái)聚焦領(lǐng)域實(shí)現場(chǎng)景創(chuàng )新,增加新的功能。例如,Authentise通過(guò)利用12,000篇科學(xué)增材制造論文的精調對通用大語(yǔ)言模型的精調,推出 3DGPT用于增材制造技術(shù)問(wèn)答。
三是從預訓練開(kāi)始構建工業(yè)大模型。 例如創(chuàng )新奇智工業(yè)大模型AInno-15B從 Llama 2、Falcon、Bloom等開(kāi)源大模型中蒸餾一部分知識,再結合自己設計的參數結構和積累的工業(yè)知識數據做訓練。經(jīng)過(guò)Pretrain、SFT和RLHF三個(gè)訓練步驟,依次使模型獲得更懂工業(yè)、支持問(wèn)答交互和答案更標準的能力。
生成式AI大模型,在制造業(yè)領(lǐng)域仍需克服三大挑戰
人工智能在工業(yè)領(lǐng)域的應用仍具備非常廣闊的空間,根據凱捷統計,只有歐洲頂級制造企業(yè)AI 應用普及率超過(guò)30%,日本制造企業(yè)AI 應用率達到30%;美國制造企業(yè)AI 應用率達到28%;中國制造企業(yè)普及率達到11%,這個(gè)調查表明人工智能在工業(yè)領(lǐng)域的普及率仍有很高的空間。但是生成式AI大模型的應用仍需面臨一些挑戰:
一是尚未出現投入產(chǎn)出比非常明確的場(chǎng)景。 在ChatGPT爆發(fā)之前,人工智能雖然在制造業(yè)擁有很多場(chǎng)景的探索,但是較為認可的領(lǐng)域仍然聚焦于的質(zhì)量檢測和設備預測性維護,這兩種場(chǎng)景被認可的核心原因就是在項目實(shí)施后的效果較為明顯,例如產(chǎn)品表面缺陷檢測能夠同過(guò)人力成本的節省來(lái)計算明確的ROI,設備預測性維護能夠基于設備故障發(fā)現的時(shí)間節點(diǎn)來(lái)衡量效果,但是在生成式AI的應用,尚未出現類(lèi)似以上兩種經(jīng)濟效應較為明顯的場(chǎng)景,大多數場(chǎng)景的探索處于試點(diǎn)和探索階段。
二是面向領(lǐng)域的基礎模型缺乏。目前面向工業(yè)領(lǐng)域大模型的做法,大多都是從精調做起,并沒(méi)有經(jīng)過(guò)預訓練階段,而預訓練才是真正知識灌輸階段,讓模型真正學(xué)習領(lǐng)域數據知識,做到適配領(lǐng)域。從精調做起或者直接集成大模型只是激發(fā)原有大模型的能力,并沒(méi)有從實(shí)現對領(lǐng)域知識的理解和推理。而當前的基礎模型發(fā)展仍處于通用大模型競爭的白熱化階段,對面向行業(yè)的基礎模型關(guān)注較少,目前也僅有少數的企業(yè)開(kāi)始從預訓練階段構建制造業(yè)領(lǐng)域的生成式大模型應用。
三是制造業(yè)領(lǐng)域場(chǎng)景高度碎片化。碎片化的場(chǎng)景對大模型這種對數據、算力要求較高的范式也提出了挑戰。工業(yè)數字化領(lǐng)域經(jīng)常流傳一個(gè)邏輯,“工業(yè)數字化是萬(wàn)億級的市場(chǎng),但其是一萬(wàn)個(gè)億級市場(chǎng)的組合”,對于細分領(lǐng)域來(lái)說(shuō),很難有足夠多可用的數據來(lái)從預訓練階段開(kāi)始訓練大模型,通用的大模型又無(wú)法適配聚焦細分領(lǐng)域的場(chǎng)景需求,這種天然的矛盾會(huì )阻礙大模型的發(fā)展。
備注:斯坦福大學(xué)用基礎模型來(lái)泛指通過(guò)自監督學(xué)習在超大規模數據上訓練并且可以適配(例如,微調)各種下游任務(wù)的模型,這些模型包含但不限于ChatGPT、Llama等。在我國伴隨著(zhù)產(chǎn)業(yè)發(fā)展,通常用大模型來(lái)泛指ChatGPT、Llama等生成式模型,本文撰寫(xiě)過(guò)程中對語(yǔ)言、圖像、多模態(tài)等各類(lèi)生成式AI沿用了目前我國產(chǎn)業(yè)界形成的共識。
來(lái)源:《騰訊研究院》