伴隨著(zhù)數字經(jīng)濟的快速發(fā)展,人工智能技術(shù)持續突破,智能時(shí)代正加速到來(lái)。在人工智能浪潮席卷下,以生成式人工智能、大模型為代表的算力應用落地開(kāi)花,也引發(fā)了算力需求的進(jìn)一步增長(cháng)。一直以來(lái),我國東部地區特別是上海深入挖掘算力融合應用場(chǎng)景,各類(lèi)大模型應用不斷推出,加速釋放算力資源服務(wù)潛能。面對新一輪人工智能發(fā)展熱潮,上海如何乘勢而上加速推進(jìn)算力在更多場(chǎng)景的應用落地?如何促進(jìn)算力更好融合實(shí)體經(jīng)濟?
上海市日前印發(fā)的《立足數字經(jīng)濟新賽道推動(dòng)數據要素產(chǎn)業(yè)創(chuàng )新發(fā)展行動(dòng)方案(2023—2025年)》明確提出,建設高效協(xié)同的算力體系,建設“E級”超算載體、人工智能公共算力平臺,因地制宜部署邊緣計算資源池,對接“東數西算”國家戰略,建設樞紐型算力調度平臺,到2025年,算力總規模較“十三五”時(shí)期末翻兩番。
上海迅速布局算力這一新基建,正是基于當前以大模型為代表的算力應用的落地開(kāi)花。最近1年,人工智能成為全球科技產(chǎn)業(yè)的熱門(mén)焦點(diǎn)領(lǐng)域。爆款產(chǎn)品ChatGPT(自然語(yǔ)言處理大模型)以其強大的對話(huà)輸出功能,讓人工智能有效輔助生產(chǎn)生活,人工智能產(chǎn)業(yè)隨之向前邁進(jìn)一大步,迅速成為資本青睞的“香餑餑”。
隨著(zhù)全球科技巨頭紛紛入局,人工智能應用在大模型領(lǐng)域打開(kāi)新局面。普遍觀(guān)點(diǎn)認為,上游算力基礎設施的持續建設、算力規模的不斷擴大、數據處理能力的迅速提升,造就了下游算力應用端ChatGPT等大模型的成功崛起,讓人工智能發(fā)展迎來(lái)“拐點(diǎn)”。
在這場(chǎng)全球參與的科創(chuàng )競技中,我國緊跟趨勢走在前沿。其中,以上海為代表的生成式人工智能(AIGC)探索將人工智能帶到新高度,國家也出臺了《生成式人工智能服務(wù)管理暫行辦法》,及時(shí)規范AIGC的開(kāi)發(fā)及應用。作為算力落地場(chǎng)景的最大突破口,國內AIGC的發(fā)展態(tài)勢如何?應用效果如何?面臨哪些挑戰?記者走訪(fǎng)了諸多業(yè)內企業(yè)與專(zhuān)家,探尋在算力支撐下,人工智能到底怎樣“為我所用”。
大模型火爆
今年的中考、高考結束后,ChatGPT、文心一言、復旦MOSS、訊飛星火等大模型緊跟熱點(diǎn),紛紛下場(chǎng)寫(xiě)起作文??戳薓OSS寫(xiě)的上海中考語(yǔ)文作文《會(huì )心之樂(lè )》后,上海市市南中學(xué)語(yǔ)文高級教師陶璐說(shuō):“我覺(jué)得MOSS總體上寫(xiě)得不錯,但大模型沒(méi)有自我意識,它怎么能真正理解‘會(huì )心之樂(lè )’呢?”上海復旦五浦匯實(shí)驗學(xué)校校長(cháng)、語(yǔ)文特級教師黃玉峰更是笑言,“如果要我打分,它肯定不及格”。
盡管人們對生成式人工智能抱有不同態(tài)度,但它已經(jīng)進(jìn)入我們的生產(chǎn)生活。
“大模型是指具有大量參數的機器學(xué)習模型,可以在訓練過(guò)程中處理大規模的數據集。ChatGPT就是具有超大規模參數的大模型。要實(shí)現大模型的訓練,必須有強有力的算力支撐?!碧祜L(fēng)全球前瞻產(chǎn)業(yè)研究院聯(lián)席院長(cháng)孔蓉表示,按照國內的發(fā)展速度,預計今年國內大模型可以達到GPT3.5的技術(shù)水平;得益于海外開(kāi)源大模型的技術(shù),會(huì )有一批國內企業(yè)達到這一水平。
國內大模型的涌現速度,也印證了孔蓉的判斷。3月16日,百度推出搭載文心大模型的文心一言;4月8日,華為更新盤(pán)古大模型;4月10日,商湯科技推出商量SenseChat;4月11日,阿里巴巴推出通義千問(wèn);此后,360、字節跳動(dòng)、科大訊飛、京東、騰訊等公司也紛紛推出了自己的大模型??萍疾咳斯ぶ悄馨l(fā)展研究中心5月底發(fā)布的《中國人工智能大模型地圖研究報告》顯示,當前國內10億參數規模以上的大模型已發(fā)布79個(gè),“百模大戰”并非戲言。7月份在上海舉辦的第六屆世界人工智能大會(huì )上,國內通用型大模型頂尖產(chǎn)品悉數到位,集中展示國內外總計30多款大模型。
國內大模型發(fā)展火爆,離不開(kāi)國內算力資源作為基礎。
燧原科技創(chuàng )始人、董事長(cháng)兼CEO趙立東表示,在大模型的技術(shù)萌芽期,訓練一個(gè)GPT3參數規模的大模型成本極為高昂。根據谷歌的經(jīng)驗,用大模型來(lái)代替谷歌每秒32萬(wàn)個(gè)查詢(xún),將新增約360億美元推理成本。此后,發(fā)展到應用加速膨脹期,大模型應用賦能千行百業(yè),所需算力又會(huì )是一波乘數效應。
上海市集成電路行業(yè)協(xié)會(huì )會(huì )長(cháng)張素心表示,“為解決算力需求問(wèn)題,國產(chǎn)芯片應匯聚合力,擴大開(kāi)發(fā)者群體,形成生態(tài)閉環(huán),繼而加速產(chǎn)業(yè)發(fā)展乃至國際化之路”。
東浩蘭生會(huì )展集團董事長(cháng)陳小宏告訴記者,在第六屆世界人工智能大會(huì )上,圍繞大模型的訓練需求,沐曦曦思N100、瀚博SG100、昆侖芯2代AI芯片等大模型應用芯片集中亮相,夯實(shí)了國內算力資源的底氣??梢哉f(shuō),隨著(zhù)大模型的火爆,算力領(lǐng)域既感到壓力,也充滿(mǎn)動(dòng)力。
應用突圍
無(wú)論是實(shí)現大模型落地應用,還是提升算力供應,都需要努力構建自主創(chuàng )新架構、滿(mǎn)足市場(chǎng)多元需求。當前無(wú)疑是一個(gè)極佳的時(shí)間窗口。
孔蓉在美國硅谷調研發(fā)現,相比國內企業(yè)爭相布局大模型,美國科技企業(yè)的研發(fā)已經(jīng)以AI應用為主。在美國企業(yè)中,AI應用已相當普遍,寫(xiě)文章、寫(xiě)郵件、數據分析、發(fā)布招聘廣告等都離不開(kāi)AI?!皣鴥却竽P途畤娭?,當務(wù)之急是應用落地。畢竟大模型研發(fā)出來(lái)就是要為生活和工作服務(wù)的?!笨兹乇硎?。
“歷經(jīng)4年技術(shù)深耕和研發(fā)迭代,百度現已升級到文心大模型3.5?!卑俣仁紫夹g(shù)官、深度學(xué)習技術(shù)及應用國家工程研究中心主任王海峰表示,文心大模型3.5在效果、功能、性能等方面有了明顯提升?!胺彩桥c語(yǔ)言文字或程序代碼打交道的應用場(chǎng)景,都可能有文心一言的用武之地?!蓖鹾7灞硎?,不少行業(yè)如能源、金融、教育等,已經(jīng)成為文心一言的應用場(chǎng)景。
要把通用大模型應用到不同行業(yè)中,仍存在不少突破口。對此,垂直的行業(yè)大模型應運而生。這類(lèi)行業(yè)模型、專(zhuān)屬模型脫胎于通用大模型,經(jīng)過(guò)有針對性的專(zhuān)業(yè)數據精調后,就可適用于垂直領(lǐng)域,為某些特定行業(yè)服務(wù)。
不久前,星環(huán)信息科技(上海)股份有限公司發(fā)布了為金融領(lǐng)域量身定做的大模型“無(wú)涯”。作為業(yè)界首款面向金融智能量化投研的領(lǐng)域大模型,它將在金融投研、量化投資和智能推理等領(lǐng)域有力輔助分析師、研究員和投資經(jīng)理的日常工作,對股票、債券、基金、商品等各類(lèi)市場(chǎng)事件進(jìn)行復盤(pán)、傳播和推演。同時(shí),基于大模型的事件驅動(dòng)與深度圖引擎,其可實(shí)現對事件語(yǔ)義刻畫(huà)、定價(jià)因子挖掘、時(shí)序編碼、異構關(guān)系圖卷積傳播等功能,幫助企業(yè)更好應對復雜的市場(chǎng)環(huán)境和業(yè)務(wù)需求。
不過(guò),目前來(lái)看,大模型應用仍存在一些問(wèn)題。星環(huán)科技創(chuàng )始人孫元浩表示,大模型有時(shí)會(huì )一本正經(jīng)“胡說(shuō)八道”,原因之一在于訓練大模型至少用時(shí)半年,這導致實(shí)時(shí)新聞資訊、市場(chǎng)行情等快速變化的信息難以?xún)戎玫侥P椭?,因此需要各?lèi)大模型發(fā)布商不斷更新語(yǔ)料與數據,這是一個(gè)不小的挑戰。
北京中關(guān)村科金技術(shù)有限公司專(zhuān)注于垂直行業(yè)和細分領(lǐng)域的大模型應用,瞄準新一代得助對話(huà)引擎,他們推出了全新的AIGC應用——“超級員工”,如智能客服、外呼機器人、智能陪練、智能質(zhì)檢、坐席助手等。該公司副總裁張杰介紹,“超級員工”以助手的形式在金融、零售、政務(wù)等多個(gè)行業(yè)頭部企業(yè)試用,原先需要10分鐘完成的營(yíng)銷(xiāo)文案,現在10秒即可完成;外呼客服話(huà)術(shù)師助手讓原來(lái)30個(gè)話(huà)術(shù)師的工作量如今由2人即可完成,且語(yǔ)義理解準確度從85%提升至94%?!按竽P途邆涞某瑥娬Z(yǔ)言理解能力,讓‘最后一公里’的銷(xiāo)售過(guò)程實(shí)現數字化轉型成為可能。這既能幫助企業(yè)通過(guò)智能對話(huà)服務(wù)實(shí)現降本增效,也能有效提升用戶(hù)體驗、拓展服務(wù)外延?!睆埥苷f(shuō)。
眾多通用大模型和垂直大模型同臺競技,結果必然是優(yōu)勝劣汰。張杰表示,在成本約束以及充分的市場(chǎng)競爭環(huán)境下,眾多大模型產(chǎn)品必然面臨“洗牌”。
面臨“洗牌”的不僅是大模型,算力領(lǐng)域同樣如此?!鞍倌4髴稹笨上惨嗫蓱n(yōu),必須直面算力“燒不燒得起”的課題。大模型訓練和推理最終要回歸商業(yè)邏輯,實(shí)現經(jīng)濟效益而非“不計代價(jià)”,這就涉及算力能否像水電煤一樣“普惠”。
燧原科技創(chuàng )始人兼COO張亞林表示,“隨著(zhù)大模型間的競爭逐漸展開(kāi),大模型在數量上會(huì )收斂,生態(tài)也會(huì )相應濃縮和集約,這對于建立AI芯片新生態(tài)來(lái)講,是非常有利的機會(huì )”。
上海天數智芯半導體有限公司不久前宣布,天垓100加速卡的算力集群,基于北京智源人工智能研究院70億參數的Aquila語(yǔ)言基礎模型,使用代碼數據進(jìn)行訓練,已穩定運行19天,且模型收斂效果符合預期,測試證明天數智芯已經(jīng)具備支持百億級參數大模型訓練的能力。天垓100加速卡的算力集群率先完成百億級參數大模型訓練,邁出了自主通用GPU大模型應用的重要一步。這一成果證明天垓產(chǎn)品可以支持大模型訓練,打通了國內大模型創(chuàng )新發(fā)展的關(guān)鍵“堵點(diǎn)”,對于我國大模型自主生態(tài)建設、產(chǎn)業(yè)鏈安全保障具有重要意義。
孔蓉說(shuō),“像ChatGPT這樣級別的大模型需要上萬(wàn)張芯片和加速卡支持,就目前國內一些商業(yè)化應用來(lái)看,不需要比拼最高算力,而是應比拼實(shí)際效率,因此性?xún)r(jià)比會(huì )是重要的影響決策因素”。趙立東也認為,“芯片是‘用進(jìn)廢退’,越用才能越好用。在漸進(jìn)式過(guò)程中培育算力生態(tài)、迭代算力產(chǎn)品,這個(gè)過(guò)程是我們必須經(jīng)歷的”。
提升競爭力
不久前印發(fā)的《上海市推進(jìn)算力資源統一調度指導意見(jiàn)》提出,開(kāi)展上海全市算力基礎設施及算力資源輸出能力摸排,形成算力清單?;谒懔Y源底數,推動(dòng)頭部企業(yè)接入上海市人工智能公共算力服務(wù)平臺,構建一體化算力調度服務(wù)體系和平臺基礎框架,實(shí)現算力資源統一編排。
“某種程度上,算力決定了市場(chǎng)競爭力?!鄙虦萍级麻L(cháng)兼CEO徐立說(shuō),在A(yíng)I大模型時(shí)代,模型參數量將以指數級速率提升,數據量隨著(zhù)多模態(tài)的引入將大規模增長(cháng),由此帶來(lái)算力需求劇增。
上海市經(jīng)信委副主任湯文侃表示,“十四五”期間,上海將加強全市算力資源統籌、調度和共享,提升算力資源利用率,加速數據要素流通,全面釋放數據價(jià)值。
上海臨港新片區6月份發(fā)布的《臨港新片區加快算力產(chǎn)業(yè)集聚發(fā)展三年行動(dòng)方案》提出,到2025年,臨港新片區將形成以智算算力為主、基礎算力和超算算力協(xié)同的多元算力供給體系,總算力超過(guò)5EFLOPS(FP32),AI算力占比達到80%,算力產(chǎn)業(yè)總體規模突破100億元,集聚相關(guān)企業(yè)及機構超過(guò)100家,打造具有全國影響力的算力產(chǎn)業(yè)集聚區,建設一批算力示范應用標桿場(chǎng)景。
一系列算力布局,是為了夯實(shí)大模型應用的底座。隨著(zhù)AIGC深度應用的展開(kāi),不僅對算力、數據、算法提出了更高要求,也對安全、隱私、倫理提出更多挑戰。只有在確保數據安全和隱私保護、健全人工智能倫理與安全的前提下,才能讓AI技術(shù)真正釋放出應用價(jià)值。
針對算力問(wèn)題,華為輪值董事長(cháng)胡厚崑表示,華為已在內蒙古烏蘭察布市建設數據中心,初期階段部署了數千卡規模的人工智能集群,在同等算力下,計算效率提升10%以上。
不久前,UCloud優(yōu)刻得AIGC算力底座正式亮相。優(yōu)刻得董事長(cháng)兼CEO季昕華表示,優(yōu)刻得推出涵蓋數據中心、計算平臺、管理平臺、網(wǎng)絡(luò )服務(wù)、應用服務(wù)、生態(tài)接口的一系列產(chǎn)品和解決方案,可為用戶(hù)提供完全物理隔離的獨享機柜、服務(wù)器、網(wǎng)絡(luò )、存儲資源,結合完整的安全方案和專(zhuān)家服務(wù),確保用戶(hù)的大模型平穩運行。
“歷史的機遇、技術(shù)的變革,將數據智能推向了前所未有的高潮,也帶來(lái)了更加嚴峻的數據安全挑戰,數據流通邁向密態(tài)化是未來(lái)趨勢。數據密態(tài)要求下,隱私計算的方法體系、平臺框架、技術(shù)標準都面臨全新變革?!蔽浵伡瘓F副總裁兼首席技術(shù)安全官韋韜呼吁更多同行參與到開(kāi)源和生態(tài)建設工作中?!伴_(kāi)源隱私計算核心產(chǎn)品一直是我們對行業(yè)的態(tài)度,未來(lái)將進(jìn)一步加大隱私計算的開(kāi)放力度和廣度,與行業(yè)一道構筑AI智能時(shí)代數據安全護城河?!表f韜說(shuō)。
盡管挑戰不少,但不可否認,以大模型為核心的人工智能時(shí)代正加速到來(lái)?!拔磥?lái)10年,新一輪科技周期將啟動(dòng)?!笨兹卣J為,在A(yíng)I推動(dòng)下,XR、機器人、自動(dòng)駕駛、影視內容等行業(yè)將進(jìn)入爆發(fā)式變革時(shí)期。
騰訊研究院、同濟大學(xué)、騰訊云共同發(fā)布的《人機共生——大模型時(shí)代的AI十大趨勢報告》明確指出,通過(guò)建設可控、可用的安全生態(tài),推動(dòng)模型落地和應用,AI技術(shù)將為各行業(yè)帶來(lái)更多機遇。大模型時(shí)代帶來(lái)的創(chuàng )新和發(fā)展,將推動(dòng)人工智能走向更廣闊的未來(lái)。
正如工業(yè)和信息化部副部長(cháng)徐曉蘭所言,以深度學(xué)習為代表的新一代人工智能和以大模型為代表的通用人工智能不斷取得技術(shù)突破,將成為智能產(chǎn)業(yè)的根技術(shù)和智能經(jīng)濟的基礎設施。這意味著(zhù)人工智能產(chǎn)業(yè)生態(tài)將醞釀一個(gè)又一個(gè)“爆點(diǎn)”,并等待著(zhù)創(chuàng )業(yè)者去把握與挖掘。
來(lái)源:《經(jīng)濟日報》