給你1張4歲小女孩的照片,再讓你從電腦屏幕上看20個(gè)女孩跳舞唱歌,每個(gè)女孩只出現3秒鐘。你能從中找出長(cháng)大后畫(huà)著(zhù)濃妝、戴著(zhù)美瞳,甚至可能整容過(guò)的她嗎?
1月6日,江蘇衛視《最強大腦》就以“匆匆那年”為主題,上演了中國版的首次人機對決:31.02秒就可記憶一副無(wú)規則撲克牌的人類(lèi)代表王峰,迎戰百度人工智能機器人“小度”。雙方先比拼人臉識別——僅憑一張童年照認出十幾年后的少女,包括一對雙胞胎;第二局,則要從30張畢業(yè)照中,即約1500個(gè)花生米大小的頭像中,根據長(cháng)大后的男生照片找出兒時(shí)的他。
同“Master”橫掃人類(lèi)圍棋大師一樣,人工智能再一次戰勝了人類(lèi)。百度大腦如何分辨長(cháng)大后的雙胞胎?它和Master哪個(gè)更厲害?它還擁有哪些神奇的功能?《經(jīng)濟日報》記者就此采訪(fǎng)了百度大腦的技術(shù)團隊,得出迄今為止最靠譜的答案。
小度認出了長(cháng)大后的雙胞胎之一,人類(lèi)沒(méi)有。
都說(shuō)“女大十八變”,比賽中,選手王峰表示,自己主要看嘴角、耳朵的相似度。在他眼里,長(cháng)幼兩張人臉被分解成一個(gè)個(gè)相似的五官形狀,此中除了運用人類(lèi)的記憶力、推理能力,還有人類(lèi)的本能。
“千百萬(wàn)年進(jìn)化過(guò)程中,人腦進(jìn)化出一個(gè)專(zhuān)門(mén)的區域負責人臉識別(簡(jiǎn)稱(chēng)FFA)?!卑俣仁紫茖W(xué)家吳恩達被戲稱(chēng)為小度的“爸爸”,他舉例說(shuō),“一個(gè)3歲的孩子看見(jiàn)媽媽時(shí),不管媽媽是微笑、生氣,睜著(zhù)眼、閉著(zhù)眼,長(cháng)頭發(fā)、短頭發(fā),穿什么衣服,孩子都可以輕易認出這是媽媽”。
但是,人腦為何一瞬間就能完成人臉識別,至今全世界的科學(xué)家也說(shuō)不清背后的原理。因此,小度對人臉的識別不是模仿人腦,而是更多基于數據分析和深度學(xué)習。
在人工智能“眼里”,它看見(jiàn)的不是一個(gè)圖形,而是一些按數字1和0記錄的像素點(diǎn)。因此,機器會(huì )把人臉?lè )譃楹芏鄠€(gè)小方塊來(lái)識別。根據眼睛、眉毛、鼻子等器官的特征及其相互之間的幾何位置關(guān)系,計算總結出這些點(diǎn),最終構成了一張人臉。
如果要辨認這張人臉是誰(shuí),機器還要提取面部特征進(jìn)行特征建模,與需要對比的人臉比較后,根據相似程度,對人臉的身份信息進(jìn)行判斷。一旦人的面貌發(fā)生任何變化,哪怕只是輕微仰頭,燈光變換,機器都需要重新計算一遍。
據百度深度學(xué)習實(shí)驗室主任林元慶介紹,“為做到盡量精確,在百度的技術(shù)中,我們會(huì )在人臉上取72個(gè)點(diǎn),最后通過(guò)神經(jīng)網(wǎng)絡(luò )計算,得到128維特征,每一維特征是人臉上的某種特點(diǎn),比如獅子鼻”。
至于如何從72個(gè)點(diǎn)的信息里總結出128種特征,并將每種特征與人臉的特點(diǎn)一一對應,這是由深度學(xué)習從海量數據里自動(dòng)學(xué)到的。換句話(huà)說(shuō),工程師并不知道這種特征究竟是“獅子鼻”,還是別的某種甚至沒(méi)有詞匯形容的特征。
計算機辨認人臉原本就非常困難,但在《最強大腦》的舞臺上,又增加了時(shí)間跨度?,F場(chǎng)嘉賓、北京大學(xué)心理學(xué)系教授魏坤琳解釋說(shuō),成長(cháng)中的人臉變化極大,一個(gè)人一輩子連身份證都要換好幾次。對于人類(lèi)來(lái)說(shuō),可以依靠整體神態(tài)、氣質(zhì)等無(wú)法言說(shuō)的因素去主觀(guān)猜測,但機器不會(huì )猜,只能根據深度學(xué)習得來(lái)的規律計算。
據林元慶介紹,為了備戰,團隊2個(gè)月里讓小度看了200萬(wàn)個(gè)人的2億張照片,并輔以少量有時(shí)間跨度的照片。經(jīng)過(guò)“訓練”,小度自己總結出了一種不為人所知的人臉隨年齡變化的規律。
在遇到蜜蜂少女隊的雙胞胎時(shí),人類(lèi)和人工智能的差別就顯示出來(lái)了:姐妹花長(cháng)大后外表幾乎一模一樣,連姐妹倆自己都分辨不出舊照片里的人是誰(shuí),王峰用肉眼也無(wú)法辨別她們的五官特征。但是,在人工智能的計算方式下,雖然她們的面部骨骼極其相似,差別特別細微,總還是有一點(diǎn)區別。最終,小度計算出,其中一位跟老照片里的小姑娘有72.98%的相似度,另一位有72.99%,差距僅為萬(wàn)分之一。
百度大腦認臉和Master下棋,哪個(gè)更難?
很巧合,在百度大腦參加最強大腦比賽的幾乎同一時(shí)間,曾經(jīng)橫掃國際象棋界的阿爾法狗改名Master,重出江湖,以60場(chǎng)連勝頂尖圍棋手的傲人成績(jì),震驚了全世界。
這也讓不少人好奇:如果Master和百度大腦比賽,誰(shuí)輸誰(shuí)贏(yíng)?
“很遺憾,這很可能將是一個(gè)永遠沒(méi)有答案的問(wèn)題?!绷衷獞c解釋說(shuō),因為百度大腦和Master學(xué)習的是兩種完全不同的技能:小度的強項是生活服務(wù),比如人臉識別和語(yǔ)音識別,從來(lái)沒(méi)有學(xué)過(guò)下棋。Master目前似乎也只會(huì )下棋,不會(huì )辨別人臉。
那么,對人工智能來(lái)說(shuō),認臉和下棋,哪個(gè)更難?
從本質(zhì)上說(shuō),百度大腦和Master都不是記憶和推理的高手,而是數學(xué)大師,只不過(guò)一個(gè)算棋局的概率,一個(gè)算人臉相似的概率。
國際象棋、圍棋等棋類(lèi)是計算每一步會(huì )帶來(lái)的概率變化,計算能力和算法越強,越能照顧到后面局勢的變化。魏坤琳認為,人類(lèi)不擅長(cháng)邏輯運算,因此,只有少數人精于下棋,頂尖高手更是鳳毛麟角。而且,人類(lèi)腦力有限,即使是聶衛平在巔峰時(shí)期,也只能在局部多計算幾個(gè)回合,無(wú)法考慮每一步對全盤(pán)戰局的影響。
但邏輯運算是電腦的強項,它每次落子,都可以考慮對全局的影響。這也是為什么聶衛平等圍棋大師會(huì )覺(jué)得Master不按常理下棋的原因。因為在某些時(shí)候,計算全局和計算局部的結果是不同的。
反過(guò)來(lái),感知和運動(dòng)是人類(lèi)擅長(cháng)的,機器卻不擅長(cháng)。機器無(wú)法理解雨打芭蕉的美,爬個(gè)樓梯也很費力,特別是臺階的高度、坡度、光照條件等參數無(wú)法預知時(shí),機器人很難像人一樣流暢地爬樓梯。
“同樣,推理辨識長(cháng)大后的人臉,不是簡(jiǎn)單的信息匹配和分類(lèi)問(wèn)題,而是從模糊復雜的信息中抽象出規律的問(wèn)題?!蔽豪ち照f(shuō),“基于極少非結構化的信息來(lái)學(xué)習推理,這恰恰是人腦擅長(cháng)的。我們把這些要素都設計到了最強大腦舞臺上的挑戰當中”。
因此,《最強大腦》科學(xué)顧問(wèn)團首席顧問(wèn)、北京師范大學(xué)心理學(xué)院院長(cháng)劉嘉在首次媒體看片會(huì )上,曾正面回應道,“小度從計算上的難度來(lái)講,甚至可能會(huì )超過(guò)Master”。
但魏坤琳不完全贊同。他反復強調這種難易比較只是“可能”,“因為,人工智能對不同認知功能有自身的難易評判,我們不能用人的直覺(jué)去作這個(gè)評判。這就像蘋(píng)果和橘子,不能比”。
我們不怕汽車(chē)比人跑得快,為什么要畏懼機器比人聰明?
這場(chǎng)比賽還有一個(gè)細節——面對小度,曾經(jīng)展現出超強記憶力、辨識力的人類(lèi)選手都不敢應戰,場(chǎng)面一度尷尬。在評委們的鼓勵下,有3位選手帶著(zhù)點(diǎn)悲壯的感覺(jué)主動(dòng)請戰,稱(chēng)“即使必輸無(wú)疑,也要維護戰隊和個(gè)人尊嚴”。
選手們的畏懼折射出當下人們對人工智能的恐懼心理。最強大腦的選手在記憶力、識別能力等方面都極其出類(lèi)拔萃。他們在人類(lèi)最擅長(cháng)的領(lǐng)域,被最不擅長(cháng)此項活動(dòng)的機器打敗,其沖擊大于當年的AlphaGo,再次引發(fā)了“人工智能威脅論”。
“恐懼未知,這是人的正常心理?!蔽豪ち沼X(jué)得,新技術(shù)出現時(shí)都會(huì )造成恐慌,汽車(chē)、火車(chē)、計算機剛問(wèn)世都有人害怕。他認為,大多數人其實(shí)是擔心自己被人工智能替代,“人工智能的出現,可能讓很多一般智力活動(dòng)甚至專(zhuān)業(yè)人員的工作受到威脅。但是,有些工作被取代了,新的工作又產(chǎn)生了,人類(lèi)整體的失業(yè)率不一定會(huì )上升”。
實(shí)際上,從人類(lèi)生活的質(zhì)量來(lái)說(shuō),有了人工智能的輔助,大家的生活變得更“智能”了,自動(dòng)駕駛、家居機器人、專(zhuān)業(yè)決策輔助,這都是前人無(wú)法想象的生活。
在比賽現場(chǎng),嘉賓就提出,小度可以幫助父母尋找失散多年的孩子,幫助公安機關(guān)搜尋偶然被攝像頭拍到的犯罪分子。從商業(yè)化的角度,百度的人臉識別已經(jīng)在浙江烏鎮景區閘機得到應用,可滿(mǎn)足每年千萬(wàn)人次的游客使用。還有一些國產(chǎn)手機也在接洽,希望使用百度的人臉識別技術(shù)。
而且,人工智能還可以做很多事情。比如小度不僅會(huì )辨別人臉,對人類(lèi)語(yǔ)音的辨別率也能達到97%;小度還可以聲情并茂地輸出語(yǔ)句,基本可以代替忙碌的媽媽給孩子們講故事。在智慧醫療、文物挽救、在線(xiàn)個(gè)性化教育等方面,人工智能大有可為。因此,近年來(lái),微軟、Facebook、IBM、谷歌、亞馬遜都投入巨資研發(fā)人工智能。在最近的消費電子展(CES 2017)上,各大廠(chǎng)商都帶來(lái)了自己的人工智能。
但是,再強的人工智能都是人類(lèi)智慧的結晶。機器只能做人教給它的東西,也無(wú)法理解人類(lèi)的感情。比如小度判斷出雙胞胎的存在,給出了兩個(gè)概率。因為兩個(gè)數字太過(guò)接近,在它的系統中無(wú)法抉擇,最終還是吳恩達幫它挑選了概率稍高的那一張。
人工智能要威脅到人類(lèi),還有很遠的距離。也許就像王峰說(shuō)的,人和機器不是敵對的關(guān)系,雖然這次他輸給了人工智能,但這其實(shí)代表人類(lèi)的科技又進(jìn)了一步。
摘自《經(jīng)濟日報》