當房子越建越高時(shí),就需要回頭看地基是不是堅實(shí)。中國科學(xué)院院士、北京大學(xué)教授張平文團隊最近在做一件事——給人工智能“大廈”夯基,即為人工智能機器學(xué)習中常用的數學(xué)符號提供一個(gè)通用標準。
人工智能作為一個(gè)高度交叉而又發(fā)展迅猛的學(xué)科,吸引了來(lái)自數學(xué)、物理、化學(xué)、生物甚至人文社科等不同領(lǐng)域的眾多研究人員參與其中。對于不同學(xué)科的研究人員來(lái)說(shuō),一個(gè)現實(shí)的問(wèn)題就是如何消除信息鴻溝。統一數學(xué)符號等基礎性工作,看似簡(jiǎn)單,卻是人工智能長(cháng)遠發(fā)展的“地基”。
“目前,人工智能的數理基礎還不成熟,但這也為廣大青年學(xué)者提供了更多創(chuàng )新機會(huì )?!痹谌涨芭e辦的2020北京智源大會(huì )上,張平文等專(zhuān)家圍繞人工智能下一個(gè)十年發(fā)展面臨的重大問(wèn)題進(jìn)行交流探討,呼吁加強人工智能數理基礎等相關(guān)研究。
有望催生新的研究方向
中國科學(xué)院院士、清華大學(xué)教授張鈸認為,第一代人工智能靠知識驅動(dòng),第二代人工智能靠數據驅動(dòng),目前進(jìn)入第三代人工智能發(fā)展期,主要靠認知驅動(dòng)?!罢J知驅動(dòng)中,深度學(xué)習研究尤為重要,發(fā)展前景廣闊,但仍需加強理論和方法等基礎性工作?!?nbsp;
張平文也認為,機器學(xué)習等深度學(xué)習理論是當前人工智能數理基礎研究的熱門(mén)方向之一。雖然在此次人工智能浪潮中,深度學(xué)習理論表現良好,但研究人員還不能解決它的可解釋性問(wèn)題。
事實(shí)上,可解釋性、可計算性、泛化性、穩定性等正是人工智能未來(lái)發(fā)展面臨的重大理論挑戰。例如可解釋性,“分兩個(gè)層面,一是從數學(xué)算法的角度解釋?zhuān)菑臄祵W(xué)模型的角度解釋機器學(xué)習的問(wèn)題。這些基礎性工作都有待深入研究?!睆埰轿恼f(shuō)。
“機器學(xué)習是從數據中挖掘出有價(jià)值的信息。數據本身是無(wú)意識的,不能自動(dòng)呈現有用的信息?!北本┐髮W(xué)長(cháng)聘教授張志華說(shuō),“怎樣才能找出有價(jià)值的信息?首先要給數據一個(gè)抽象的表示,然后進(jìn)行建模,再進(jìn)行計算?!?/p>
“機器學(xué)習想要實(shí)現的是從數據到?jīng)Q策到預測的過(guò)程,這意味著(zhù)很多新問(wèn)題會(huì )出現,而這些新問(wèn)題都有賴(lài)于通過(guò)加強算法、模型等數理基礎研究來(lái)解決?!睆埰轿谋硎?,數理基礎研究無(wú)法在短時(shí)間內實(shí)現,需要開(kāi)展大量工作。
反過(guò)來(lái),“人工智能數理基礎研究對數學(xué)發(fā)展也非常重要,研究界期待未來(lái)可以產(chǎn)生類(lèi)似于概率論的新的研究方向。雖然短時(shí)間內不太可能實(shí)現,但仍有這種可能性?!睆埰轿恼f(shuō)。
為此,張平文鼓勵廣大青年學(xué)者投身人工智能數理基礎研究,“數理基礎研究別具活力,希望通過(guò)大家的努力使它趨于成熟,產(chǎn)生更多原創(chuàng )性成果”。
從應用出發(fā)定夯基計劃
人工智能數理基礎研究涉及數學(xué)、概率統計、計算機理論等眾多學(xué)科,不同學(xué)科、不同研究方向使用的數學(xué)記號和表述不盡相同??雌饋?lái)相去甚遠的兩個(gè)記號,可能表達的是同一個(gè)概念;在一個(gè)學(xué)科已經(jīng)公認的優(yōu)美、簡(jiǎn)單的記號,在另一個(gè)學(xué)科或許還需被重現發(fā)現、重新定義,而新定義的記號很可能遠不如已有的記號方便。
這給新進(jìn)入該領(lǐng)域的科研人員和工程人員造成了不少麻煩。北京大學(xué)教授李鐵軍說(shuō):“機器學(xué)習的普及,迫切需要制定一套統一的數學(xué)記號。這將大大減輕研究人員在不同符號體系間反復切換的工作量?!?/p>
為人工智能研究提供一套統一的符號標準,這項基礎工作“增強了不同領(lǐng)域研究人員的互相理解。研究人員在看其他領(lǐng)域成果的時(shí)候,也更容易看懂”。張平文呼吁研究人員在科研中盡量采用同一套符號標準來(lái)交流、寫(xiě)論文,并為完善符號標準而努力。
也就是說(shuō),基礎研究要與應用結合起來(lái)?!伴_(kāi)展人工智能研究不能憑空想象,必須了解實(shí)際問(wèn)題,考慮實(shí)際應用需要?!睆埰轿恼f(shuō)。
北卡羅來(lái)納大學(xué)教堂山分校終身教授朱宏圖對此表示認同。他說(shuō):“人工智能領(lǐng)域的研究應該從應用角度出發(fā)?!?/p>
“人工智能的核心是如何利用收集的數據來(lái)為用戶(hù)創(chuàng )造價(jià)值,提高用戶(hù)滿(mǎn)意度?!敝旌陥D認為,隨著(zhù)收集數據的方法越來(lái)越多、頻率越來(lái)越高,為用戶(hù)提供相應的方案也會(huì )越來(lái)越多?!斑@為人工智能研究帶來(lái)了新機遇?!?/p>
朱宏圖表示,從研究需要出發(fā),為用戶(hù)提供更好的方案和服務(wù)環(huán)境,也需要加強算法、模型等數理基礎研究。
“人工智能數理基礎研究,一方面要強調它與應用的連接,另一方面也應該基于數學(xué)本身的基本問(wèn)題開(kāi)展研究?!崩铊F軍認為,雖然數理基礎研究當下可能跟應用聯(lián)系并不緊密,但有可能提供一些最基本的數學(xué)語(yǔ)言,深化人類(lèi)對人工智能數學(xué)結構的認識。
實(shí)踐是檢驗合作實(shí)效的“金鑰匙”
夯實(shí)人工智能“大廈”,加強數理基礎研究,“主要有兩條路,一是從高維空間走向低維空間,二是從低維空間走向高維空間,但無(wú)論哪條路都存在困難?!睆埰轿恼f(shuō),不管走哪條路,都需要加強學(xué)術(shù)界與產(chǎn)業(yè)界及不同領(lǐng)域間的交流。
與會(huì )專(zhuān)家認為,一直以來(lái),產(chǎn)業(yè)界與研究界的信息鴻溝制約著(zhù)數理基礎研究的進(jìn)度。產(chǎn)業(yè)界擁有研究界缺乏的大數據,而產(chǎn)業(yè)界欠缺研究界對實(shí)際應用背后的科學(xué)認識。
朱宏圖同時(shí)還擔任滴滴出行公司的首席統計學(xué)家。他表示,人工智能領(lǐng)域相關(guān)研究,數據在其中起著(zhù)越來(lái)越重要的作用。企業(yè)積累了豐富的數據,這是人工智能研究的重要基礎。
目前,在張平文等業(yè)內人士的努力下,北京智源人工智能研究院已設立“人工智能數理基礎”重大研究方向,聯(lián)合全國相關(guān)科研院所和產(chǎn)業(yè)界人士,致力于打破基于計算機實(shí)驗和神經(jīng)科學(xué)的人工智能的慣用建模范式,以可解釋性的新型人工智能模型、新型機器學(xué)習算法、深度學(xué)習的基礎研究等為研究?jì)热?,建立以數學(xué)與統計理論為數理基礎的新一代人工智能方法論。
香港浸會(huì )大學(xué)兼職教授季春霖認為,研究將會(huì )面臨挑戰。他舉例說(shuō),在材料設計中,機器學(xué)習提供了新方法,但既有機器學(xué)習模型并不能直接拿來(lái)用,還需要把機器學(xué)習的模型和材料物理的模型結合起來(lái)。
在他看來(lái),人工智能數理基礎研究需要產(chǎn)業(yè)界和研究院所合作。這樣的合作將為行業(yè)發(fā)展創(chuàng )造更大空間,而實(shí)踐必將成為檢驗合作實(shí)效的一把“金鑰匙”。
來(lái)源:《中國科學(xué)報》