美國加州舊金山谷歌人工智能(AI)研究人員Ali Rahimi去年12月對其所在研究領(lǐng)域進(jìn)行了一次猛烈的抨擊,并獲得了40秒的掌聲。在一次AI會(huì )議上,Rahimi指責機器學(xué)習算法,即計算機通過(guò)反復試驗和糾錯來(lái)學(xué)習已經(jīng)成為某種形式的“煉金術(shù)”。他說(shuō),研究人員并不知道為什么有些算法會(huì )起作用而另一些不會(huì ),他們在選擇一個(gè)AI架構而非另一個(gè)時(shí)也沒(méi)有嚴格的標準。在近日于加拿大溫哥華舉行的關(guān)于學(xué)習表現的國際會(huì )議上發(fā)表的一篇論文中,Rahimi和合作者列舉了他們所看到的“煉金術(shù)問(wèn)題”,并為提高AI的嚴格性開(kāi)了“藥方”。
“這個(gè)領(lǐng)域有一種痛苦?!盧ahimi說(shuō),“我們很多人覺(jué)得自己在使用一種完全不同的技術(shù)?!?/p>
這個(gè)問(wèn)題與AI的再現性問(wèn)題截然不同,由于實(shí)驗和出版實(shí)踐的不一致,研究人員無(wú)法復制彼此的結果。它也不同于機器學(xué)習中的“黑箱”或“可解釋性”問(wèn)題:解釋某一特定AI如何得出結論的難題。正如Rahimi所言,“我試圖把機器學(xué)習系統的‘黑箱’與轉變?yōu)楹谙涞恼麄€(gè)領(lǐng)域區分開(kāi)來(lái)?!?/p>
他說(shuō),如果不深入了解構建和訓練新算法所需要的基本工具,研究人員創(chuàng )建AI就會(huì )像中世紀的煉金術(shù)士一樣訴諸于謠言。加州山景城谷歌計算機學(xué)家Francois Chollet補充道:“人們被狂熱崇拜所吸引”,依賴(lài)的是“民間傳說(shuō)和魔法咒語(yǔ)”。他舉例說(shuō),他們采用寵物的方法調整AI的“學(xué)習速率”(一個(gè)算法在每個(gè)錯誤之后會(huì )在多大程度上進(jìn)行糾正),而不是了解為什么一個(gè)算法比其他的更好。在其他情況下,AI研究人員訓練其算法只是在黑暗中磕磕碰碰。例如,他們執行所謂的“隨機梯度下降”,以此優(yōu)化一個(gè)算法的參數,以獲得盡可能低的失敗率。然而,盡管有數千篇關(guān)于這一主題的學(xué)術(shù)論文,以及無(wú)數應用該方法的途徑,這一過(guò)程仍然依賴(lài)于嘗試和糾錯。
Rahimi的論文強調了被浪費掉的努力以及可能導致的次優(yōu)表現。例如,它指出,當其他研究人員從最先進(jìn)的語(yǔ)言翻譯算法中去掉大部分的復雜性時(shí),它實(shí)際上能夠把英語(yǔ)更好地翻譯成德語(yǔ)或法語(yǔ),而且效率更高,這表明其創(chuàng )建者并沒(méi)有完全理解那些額外部分有什么好處。相反,英國倫敦推特網(wǎng)機器學(xué)習研究人員Ferenc Huszar說(shuō),有時(shí)候,附加在算法上的鈴聲和哨聲是唯一優(yōu)秀的部分。他說(shuō),在某些情況下,算法的核心存在技術(shù)缺陷,這意味著(zhù)其得出的好結果“完全歸因于在上面應用的其他技巧”。
Rahimi對了解哪種算法最有效提供了若干建議。他說(shuō),對于初學(xué)者來(lái)說(shuō),研究人員應該像翻譯算法那樣進(jìn)行“切除研究”:一次刪除一個(gè)算法的某些部分,以查看每個(gè)組件的功能。
他呼吁進(jìn)行“切片分析”,在此過(guò)程中,需要對一個(gè)算法的性能進(jìn)行詳細分析,以了解某些地方的改進(jìn)是否會(huì )在其他方面產(chǎn)生成本。他還說(shuō),研究人員應該對其算法進(jìn)行許多不同條件和設置的測試,并報告所有測試的性能。
加州大學(xué)伯克利分校計算機學(xué)家、Rahimi煉金術(shù)主題演講論文的共同作者Ben Recht表示,AI應向物理學(xué)取經(jīng),該領(lǐng)域的研究人員經(jīng)常把問(wèn)題縮小到更小的“玩具問(wèn)題”。他說(shuō):“物理學(xué)家在設計簡(jiǎn)單的實(shí)驗以找到現象的解釋方面非常驚人?!币恍〢I研究人員已經(jīng)開(kāi)始采用這種方法,在處理大型彩色照片之前,先在小型黑白手寫(xiě)字符上測試圖像識別算法,以更好地理解該算法的內部機制。
倫敦深度思維計算機科學(xué)家Csaba Szepesvari表示,該領(lǐng)域還需要減少對競爭性測試的重視。他說(shuō),現在如果一篇論文報告的算法優(yōu)于某些基準,而非闡明該軟件的內部工作原理,就更有可能被發(fā)表。這就是花哨的翻譯算法通過(guò)同行評審的方式?!翱茖W(xué)的目的是產(chǎn)生知識,”他說(shuō),“你需要生產(chǎn)出別人可以使用并可以它為基礎的東西?!?/p>
并非所有人都同意Rahimi和Recht的批評。臉譜網(wǎng)紐約首席AI科學(xué)家Yann LeCun擔心,把太多的精力從尖端技術(shù)轉移到核心理解上,可能會(huì )減緩創(chuàng )新,阻礙AI的實(shí)際應用?!斑@不是煉金術(shù),而是工程學(xué)?!彼f(shuō),“工程學(xué)是散亂復雜的?!?/p>
Recht發(fā)現一個(gè)適合系統性且允許冒險研究的地方?!拔覀儍烧叨夹枰??!彼f(shuō),“我們需要了解故障來(lái)自哪里,這樣就可以建立可靠的系統;我們必須向前推進(jìn)邊界,這樣就能沿著(zhù)這條路線(xiàn)擁有更好的系統?!?/p>
摘自《中國科學(xué)報》