硅谷巨頭如谷歌、蘋(píng)果和臉譜都在通過(guò)訓練模擬人腦的神經(jīng)網(wǎng)絡(luò )模型來(lái)發(fā)展人工智能技術(shù)。據美國電氣和電子工程師協(xié)會(huì )《光譜》網(wǎng)站報道,美國田納西州的數字推理公司近日宣布,已建成一個(gè)包含1600億參數的神經(jīng)網(wǎng)絡(luò )模型——比之前的至少大10倍。
這一神經(jīng)網(wǎng)絡(luò )模型輕而易舉地刷新了之前的紀錄:谷歌和美國勞倫斯?利弗莫爾國家實(shí)驗室的神經(jīng)網(wǎng)絡(luò )模型分別包含112億參數和150億參數。此外,數字推理公司的神經(jīng)網(wǎng)絡(luò )模型在應對含有2萬(wàn)個(gè)詞語(yǔ)類(lèi)比的行業(yè)標準數據集時(shí),也表現出更好的精確性:86%的正確率,遠高于谷歌神經(jīng)網(wǎng)絡(luò )模型創(chuàng )下的76%正確率的紀錄。
數字推理公司首席技術(shù)官馬修?拉塞爾在新聞發(fā)布會(huì )上表示:“我們對這一神經(jīng)網(wǎng)絡(luò )模型創(chuàng )造的成績(jì)和對人工智能深度學(xué)習所做的貢獻感到非常驕傲。”
近幾年,由于機器學(xué)習技術(shù)取得眾多突破性進(jìn)展,人工智能領(lǐng)域正在經(jīng)歷一輪“復興”。其中備受重視的機器學(xué)習策略是增強學(xué)習。運用這種策略,電腦程序通過(guò)反復試錯可以得知什么樣的行為可以獲得獎勵,但是電腦程序在處理接近現實(shí)世界難度的數據時(shí)往往力不從心。為了對其進(jìn)行升級,研發(fā)人員將增強學(xué)習與卷積神經(jīng)網(wǎng)絡(luò )技術(shù)結合起來(lái),這就是所謂的深度學(xué)習策略。
深度學(xué)習涉及對機器人構建五層或更多層的人工神經(jīng)網(wǎng)絡(luò ),這里的深度指的是神經(jīng)網(wǎng)絡(luò )的層數而不是知識的深度。在神經(jīng)網(wǎng)絡(luò )模型中,所有人工神經(jīng)元都會(huì )接入數據庫并共同解決問(wèn)題,例如閱讀書(shū)寫(xiě)筆跡或辨認講話(huà)內容。神經(jīng)網(wǎng)絡(luò )模型可以通過(guò)改變神經(jīng)元之間的連接方式來(lái)調整它們之間的互動(dòng)并繼續解決下一個(gè)問(wèn)題。通過(guò)訓練,神經(jīng)網(wǎng)絡(luò )模型可以學(xué)會(huì )哪種模式是處理問(wèn)題的最佳途徑。臉譜人工智能研究實(shí)驗室負責人雅恩?樂(lè )昆曾把深度學(xué)習描述為“讓機器人學(xué)習表達世界”。
數字推理公司為了讓其神經(jīng)網(wǎng)絡(luò )模型在處理詞語(yǔ)類(lèi)比數據集時(shí)達到一定的精確性,使用了三臺多核電腦對其進(jìn)行訓練。該公司計劃在近期使用更大的數據集和詞匯量對其神經(jīng)網(wǎng)絡(luò )模型進(jìn)行測試。
摘自 中國科技網(wǎng)