“大數據”這個(gè)詞熱了十年,“人工智能”這個(gè)詞熱了也超過(guò)了一年?;仡櫧鼉赡甑陌l(fā)展,我們會(huì )發(fā)現在很多領(lǐng)域機器其實(shí)都超過(guò)了人類(lèi)。這代表什么樣的商機呢?是人類(lèi)歷史以來(lái)最大的商機。
我們已經(jīng)看到移動(dòng)互聯(lián)網(wǎng)是個(gè)巨大的市場(chǎng),但它連人工智能的十分之一都沒(méi)有。十年后,如果我們回顧人類(lèi)的發(fā)展,會(huì )發(fā)現沒(méi)有任何市場(chǎng)比人工智能來(lái)得更大。
我從30年前就開(kāi)始探索人工智能,但是沒(méi)有天時(shí)地利人和——機器不夠快,大數據中心不存在,數據不夠多,算法不夠先進(jìn)……30年來(lái),不斷有科學(xué)家發(fā)明新的技術(shù),雖然人工智能還有很多局限,沒(méi)有情感,一次只能涉足一個(gè)領(lǐng)域,不能跨領(lǐng)域思維,但是從最近四五年開(kāi)始,這些技術(shù)在很多狹窄領(lǐng)域里已經(jīng)遠遠超過(guò)了人類(lèi)。
如何用一個(gè)更通俗的方法解釋什么是人工智能?想象一臺機器是剛出生的小寶寶,人類(lèi)的小寶寶是用教育、用知識、用書(shū)本讓他們慢慢成長(cháng),但人工智能用什么來(lái)幫助他們成長(cháng)呢?就是大數據。
但是機器一次只能專(zhuān)注在某一個(gè)領(lǐng)域,在單一領(lǐng)域它可以做得非常好,但是跨領(lǐng)域做不到,所以人類(lèi)還是有機會(huì )的。美國科學(xué)家發(fā)明的深度學(xué)習在中國已經(jīng)普遍開(kāi)始使用,就是這個(gè)道理。
由于我們可以統籌各種知識和經(jīng)驗,姑且認為人的大腦還是比機器優(yōu)秀。但是機器有一個(gè)特別大的優(yōu)勢,即“過(guò)目不忘”,不僅可以?xún)Υ娲罅繑祿?,而且能夠從數據中學(xué)會(huì )推理。
我們投資的一家做人臉識別的公司,訓練的是50億張人臉,比我們多看了1000倍,我們要用一輩子時(shí)間,它可能是只用三天時(shí)間就記住了。所以現在保安這一類(lèi)用人臉來(lái)做的工作根本比不上人工智能。
再以無(wú)人駕駛為例,一個(gè)人,即便一天開(kāi)100公里,一年365天地開(kāi),三五十年累積起來(lái)可能也就幾百萬(wàn)公里的經(jīng)驗。但是今天特斯拉已經(jīng)有20億公里數據,比我們多了1000倍,而且算法還在不斷演進(jìn),它已經(jīng)超過(guò)了人類(lèi)。
海量的大數據在很多狹窄的領(lǐng)域遠遠擊敗人類(lèi)所能夠做的極限,可以說(shuō),人類(lèi)永遠不會(huì )有任何機會(huì )勝過(guò)機器。比如我們讀一本書(shū)的速度是很慢的,而IBM人工智能參加電視比賽的時(shí)候,一天就能夠把全部美國國會(huì )圖書(shū)館的所有藏書(shū)讀完。
大數據正在各個(gè)領(lǐng)域幫助人類(lèi)創(chuàng )造價(jià)值。今天人們都在做大數據的人工智能,如百度的一條搜索,今日頭條的排序,淘寶推薦的每個(gè)產(chǎn)品,滴滴每次對接司機……這背后都是人工智能。
結合大數據的人工智能,可以廣泛應用于傳統領(lǐng)域,比如銀行、保險、券商、機器人炒股。我個(gè)人的投資已經(jīng)兩年沒(méi)有給人,都是機器人幫我理財,但回報一定比人要好,這些領(lǐng)域人類(lèi)根本不是對手。
在醫療、教育等其他傳統領(lǐng)域也存在著(zhù)大量數據,機器算法、人工智能可能幾天之后就能比人做得更好,產(chǎn)生的商業(yè)價(jià)值是不可想象的,超過(guò)互聯(lián)網(wǎng)和人類(lèi)所有的歷史累積。
創(chuàng )新工場(chǎng)不只是在做預測。我們所管理的基金投資孵化的項目,超過(guò)一半是針對這個(gè)領(lǐng)域的,我們是真金白銀在賭即將來(lái)臨的人工智能時(shí)代。
這個(gè)時(shí)代即將來(lái)臨,我們能做什么事情呢?
首先是建立好一體化大數據中心。這個(gè)事情最重要,為什么呢?所有應用需要的數據不是一個(gè)公司能夠收集的,這個(gè)數據中心必須一體化,因為除了應用里面的數據之外,用戶(hù)填的數據,外面還要抓取各種數據。
我們還希望收集在一體化數據中心里的數據能得到很好的保護,從而能夠探索將這些數據變成服務(wù),幫助創(chuàng )業(yè)公司創(chuàng )造價(jià)值。
比如說(shuō)要做一個(gè)貸款的APP,不能只是依靠用戶(hù)填寫(xiě)的幾樣數據就決定貸不貸,背后還要有整個(gè)征信數據,包括出行數據、消費數據等等。它可能提交一個(gè)要求,讓大數據人工智能判斷這個(gè)人還款概率是多少,欺詐概率是多少,有否犯罪記錄,這些都可以算清楚,而且并不需要暴露用戶(hù)隱私數據。
二是計算資源。這對創(chuàng )業(yè)公司來(lái)說(shuō)特別重要。APP時(shí)代,我們常說(shuō)中國創(chuàng )業(yè)成本達到歷史新低,很不幸,人工智能加大數據,創(chuàng )業(yè)成本將會(huì )達到歷史新高。我們投資的一家公司,七個(gè)小朋友,沒(méi)有人超過(guò)三十歲,他們成立的第一天,就把我們打的款花完了,還只是買(mǎi)了一些機器,因為做的是無(wú)人駕駛。
但我們不可能讓成千上萬(wàn)的雙創(chuàng )項目都買(mǎi)機器。要把這些機器放在數據中心里,將CPU和GPU的功能很好結合,談個(gè)更好的采購價(jià)錢(qián),不同的時(shí)段按照使用收費,這個(gè)也是未來(lái)大數據能夠提供的潛在機會(huì )。
第三是數據量需要非常多。數據收集是一個(gè)逐漸的過(guò)程。有些數據可能不能公開(kāi),有些公司數據可能需要保護隱私,但是可以用API做一個(gè)接口,不泄露數據。這些數據怎樣整合起來(lái)?首先要有一個(gè)一體化數據中心。
谷歌成立了一家公司,旗下有100萬(wàn)臺數據庫服務(wù)器,是世界上最大的一體化數據中心,它把所有數據加以利用,用在搜索就是谷歌,用在診斷就是谷歌健康,用在汽車(chē)就是無(wú)人駕駛……背后都是人工智能加上一體化大數據。
四是要培訓大量人才。人工智能聽(tīng)起來(lái)非常高深,但是培養一個(gè)人工智能工程師,需要多久呢?這么高深的技術(shù)也許至少要十年、二十年?做網(wǎng)絡(luò )安全的都是要有十五、二十年的工齡,做計算機網(wǎng)絡(luò )和其他的領(lǐng)域都要讀博士再做十年工作吧?實(shí)際上,一個(gè)優(yōu)秀的理工學(xué)生半年就可以成為AI工程師,應該做一個(gè)更大的平臺培訓年輕人。
創(chuàng )新工場(chǎng)看到了這些機會(huì ),正在策劃成立一個(gè)產(chǎn)業(yè)聯(lián)盟,我們非常希望把這個(gè)聯(lián)盟建立起來(lái)。在計算方面,數據中心方面,和北京供銷(xiāo)大數據集團合作,在購買(mǎi)大數據方面政府能提供多少,業(yè)界能買(mǎi)多少,能夠授權多少,我們希望也能統籌大數據這件事。
這幾件事情里特別核心的一件就是大數據中心和人工智能算法的整合。讓我們一起來(lái)引領(lǐng)人工智能和大數據時(shí)代的來(lái)臨。
來(lái)源:汽車(chē)生態(tài)圈微信號