老司机午夜精品99久久免费_存在兩大挑戰和三大基本科學(xué)問(wèn)題

存在兩大挑戰和三大基本科學(xué)問(wèn)題

點(diǎn)擊數：792 發(fā)布時(shí)間：2016-10-16 09:37:00
分享到：

關(guān)鍵詞：

對于結構化信息的處理能力，機器遠遠超過(guò)人，比如說(shuō)一些報表；但對于非結構化的信息，比如說(shuō)聽(tīng)覺(jué)信息，人要遠遠強于機器人，比如人可快速在人群里找到熟悉的朋友。盡管機器的計算速度提升比較快，但計算機的認知能力還非常落后，它的認知能力甚至不及一個(gè)三歲小孩。

“如果有一天你坐在車(chē)里面，沒(méi)有駕駛員，或者駕駛員沒(méi)有把握方向盤(pán)，千萬(wàn)不要震驚，因為我們已經(jīng)進(jìn)入了一個(gè)無(wú)人駕駛時(shí)代”，這是清華大學(xué)教授、863計劃專(zhuān)家組成員孫富春教授在CCF-GAIR大會(huì )上演講的開(kāi)場(chǎng)白。

他還不無(wú)自豪的介紹了其創(chuàng )辦的中國智能車(chē)未來(lái)挑戰賽取得的成就：“你可能難以想象，從長(cháng)沙到武漢2800多公里的路段里，有雨天也有晴天，人工干預僅僅占整個(gè)路段的0.75%；從北京到天津150多公里的路段里，沒(méi)有人工干預，實(shí)現全程的自主駕駛……”

作為國家自然科學(xué)基金委員會(huì )重大研究計劃“視聽(tīng)覺(jué)信息的認知計算”指導專(zhuān)家組的一員，孫富春教授介紹，該研究計劃在2000年披露，經(jīng)過(guò)8年的論證，直到2008年才在國家自然基金委立項，至今走過(guò)8年，要感謝許許多多人。

“視聽(tīng)覺(jué)信息的認知計算”研究計劃

視聽(tīng)覺(jué)信息首先是“看到”。上帝對人特別青睞，從眼睛到微曲的皮層，我們經(jīng)歷的是感知部分和信息處理部分，還有連接二者的中間環(huán)節。這么長(cháng)的路徑，觸覺(jué)、聽(tīng)覺(jué)等其他感覺(jué)是沒(méi)辦法做到的，所以眼睛被稱(chēng)為心靈的窗戶(hù)。

視聽(tīng)覺(jué)信息研究對象

數據顯示，人類(lèi)獲取外界的信息80%來(lái)自視覺(jué)，而且，大腦皮層的60%都與視覺(jué)相關(guān)。當然，聽(tīng)覺(jué)也是非常重要的部分。

先鋒科學(xué)家揭示，自然圖像經(jīng)過(guò)稀疏編碼以后的基函數與微曲的皮層細胞感受的反應特性是一致的。這一發(fā)現也為未來(lái)通過(guò)稀疏編碼的方式來(lái)研究視覺(jué)編碼奠定了理論基礎。

據孫教授介紹，在專(zhuān)家組近年的研究中，發(fā)現觸覺(jué)與視覺(jué)是同構的（讓人想到盲人和失聰者的眼睛特別好）。未來(lái)可以通過(guò)人工攝像機把視覺(jué)編碼變成觸覺(jué)編碼，讓盲人感受到外部的世界（這兩年也已經(jīng)有人工視網(wǎng)膜的出現）。

專(zhuān)家組還發(fā)現，語(yǔ)音在稀疏編碼下的去燥特性、增強特性非常好。語(yǔ)音是否也具有與觸覺(jué)一樣的底層結構呢？這正是需要研究的問(wèn)題。

所以，本計劃中的“視聽(tīng)覺(jué)信息”研究對象主要是指與人視聽(tīng)覺(jué)感知相關(guān)的圖像、語(yǔ)音以及文本信息，目的是促進(jìn)計算機對這類(lèi)信息實(shí)現有效的處理和理解。

機器認知能力不如三歲小孩

事實(shí)上，日常生活中視聽(tīng)覺(jué)信息非常多，有各種各樣的工具（信息器）比如手機、攝像機、網(wǎng)絡(luò )攝像機、衛星遙感等來(lái)捕捉這些信息。

網(wǎng)絡(luò )產(chǎn)生前，大家生活在二元世界里，彼時(shí)的機器人智能都是局部的；如今在網(wǎng)絡(luò )世界中，機器人完全可以實(shí)現全局智能。比如自動(dòng)駕駛汽車(chē)可以在網(wǎng)上找到一條路徑，通過(guò)地圖規劃路徑，借助攝像機的形態(tài)識別找到我們今天的會(huì )場(chǎng)，這就是網(wǎng)絡(luò )的神奇。

網(wǎng)絡(luò )上有海量的視聽(tīng)覺(jué)感知數據。如何有效地快速地發(fā)現這些數據，通過(guò)及時(shí)有效的處理把它變成可用的知識，這是無(wú)人駕駛研究中非常重要的部分。

目前，對于結構化信息的處理能力，機器遠遠超過(guò)人，比如說(shuō)一些報表；但對于非結構化的信息，比如說(shuō)聽(tīng)覺(jué)信息，人要遠遠強于機器人，比如人可快速在人群里找到熟悉的朋友，有人駕駛汽車(chē)可以在任意非常復雜的環(huán)境中進(jìn)行駕駛，而無(wú)人駕駛目前還辦不到。

盡管機器的計算速度提升比較快，但計算機的認知能力還非常落后，它的認知能力甚至不及一個(gè)三歲小孩。

兩大挑戰和三大基本科學(xué)問(wèn)題

8年來(lái)，我們的目的就是研究人類(lèi)視聽(tīng)覺(jué)的認知機理，發(fā)展新的高效計算模型，提高計算機對與人視聽(tīng)覺(jué)感知相關(guān)的圖像、語(yǔ)音和文本信息的理解能力和處理效率，在無(wú)人駕駛的平臺上進(jìn)行驗證。目前，圍繞認知過(guò)程的表達與計算有兩大挑戰和三大基本科學(xué)問(wèn)題。

兩大挑戰：

1、復雜感知信息的理解

2、海量異構信息的計算。

三大基本科學(xué)問(wèn)題：

1、感知基本特征的提取、表達和整合，主要是要探索人力視聽(tīng)覺(jué)信息基本特征的提取、表達與整合機理，為建立相關(guān)高效計算模型奠定基礎。

2、感知數據的機器學(xué)習與理解，主要圍繞圖像、語(yǔ)音和語(yǔ)言數據的非結構化和半結構化特點(diǎn)使計算機難以實(shí)現從數據層到語(yǔ)義層的轉化，建立新的機器學(xué)習方法是實(shí)現這種轉化的有效途徑。

3、關(guān)于跨模態(tài)信息的協(xié)同計算。

目前，三個(gè)關(guān)鍵技術(shù)都取得了突破，比如在視聽(tīng)覺(jué)信息的協(xié)同計算、自然語(yǔ)言的理解與視聽(tīng)覺(jué)認知相關(guān)的腦機接口方面，已經(jīng)建立無(wú)人駕駛平臺、腦機接口平臺和搜索引擎；還創(chuàng )建了無(wú)人車(chē)未來(lái)挑戰賽以及腦機接口比賽兩個(gè)國際性的賽事；同時(shí)收獲了國際科學(xué)獎項。

孫富春在演講中提到，“我們還把腦機接口用在無(wú)人駕駛方面，通過(guò)腦控來(lái)控制無(wú)人車(chē)的運動(dòng)。另外還通過(guò)腦機接口實(shí)現自動(dòng)泊車(chē)。目前，在非浸入式腦機接口方面，中國處于世界領(lǐng)先地位”。

駕駛腦

在孫富春教授看來(lái)，駕駛腦是專(zhuān)家組這些年研究的突出成果，它主要的工作是模擬人的駕駛經(jīng)驗，學(xué)習人眼和聽(tīng)覺(jué)的感知進(jìn)行表達和融合，在環(huán)境中作出決策。

當然，這個(gè)過(guò)程中要去掉人在駕駛過(guò)程的一些情緒的影響。

人的性格決定他開(kāi)車(chē)是保守還是張揚；長(cháng)期記憶區存儲人在長(cháng)期駕駛過(guò)程里形成的經(jīng)驗和技巧；動(dòng)機就是完成出行任務(wù)從起點(diǎn)到終點(diǎn)的一次性路徑規劃；短期記憶主要表示駕駛員的選擇性注意，僅僅關(guān)注剛剛過(guò)去的以及當前的周邊駕駛態(tài)勢。

拒絕人腦中的情緒部分進(jìn)入駕駛腦，永遠不會(huì )因情緒而分散注意力，機器始終專(zhuān)注。

我們的眼睛、耳朵可以感知外面的環(huán)境，比如說(shuō)在哪里，這旁邊有沒(méi)有障礙和目標，通過(guò)長(cháng)期記憶區來(lái)決策這種情況下我應該如何駕駛，這叫行動(dòng)。

然后把行動(dòng)的信息和感知信息進(jìn)行比對，確認是不是達到了效果，就形成這樣一個(gè)閉環(huán)：從動(dòng)態(tài)感知到態(tài)勢分析、自主決策到精確的控制和行動(dòng)。

駕駛腦感知域、認知域及行動(dòng)域的工作閉環(huán)

這里面還有一個(gè)很重要的概念就是路權：行進(jìn)過(guò)程中車(chē)本身占有的空間。在這個(gè)基礎上形成了自主決策。比如速度應該有多少變化，轉角應該多大的變化，形成決策記憶池。通過(guò)控制模塊控制無(wú)人車(chē)，從感知到?jīng)Q策再到控制，形成閉環(huán)。

駕駛腦是通過(guò)英偉達的Drive PX實(shí)現的自動(dòng)駕駛硬件系統。

無(wú)人車(chē)未來(lái)挑戰賽

據悉，從2009年開(kāi)始到去年，該項賽事總共舉辦了7次比賽：

無(wú)人車(chē)挑戰賽歷程

從比賽的結果來(lái)看，人工干預最后基本取消，速度是越來(lái)越快，比賽也從局限的封閉道路越來(lái)越走向真實(shí)的道路環(huán)境里面。

回顧這8年來(lái)，孫富春教授指出下面這些工作對他們的幫助很大：

第一是認知機理研究成果，如何形成可計算的模型，這個(gè)我們探索了很多的方法，還需要進(jìn)一步地完善。

第二是在環(huán)境感知的拓撲結構信息如何在認知過(guò)程中表達與理解，探索新興的多模態(tài)傳感器。其中包括：

1、聲音、視頻信息的集成。

2、人機智能混合問(wèn)題，這個(gè)也是剛剛國家提到的人工智能2.0版本，我們要研究人機混合的智能系統。

3、借助這個(gè)平臺發(fā)表更多的關(guān)于認知科學(xué)方面的成果，將自然語(yǔ)言理解和腦機接口集成到無(wú)人車(chē)的平臺上，讓成果走出實(shí)驗室。

第三是通過(guò)無(wú)人車(chē)平臺取得的重大進(jìn)展，進(jìn)一步促進(jìn)創(chuàng )新，引領(lǐng)無(wú)人車(chē)產(chǎn)業(yè)的發(fā)展。

尾聲，孫富春教授以詩(shī)為寄：“人機仿造勝奴仆，親我勞耕續史書(shū)”。

摘自雷鋒網(wǎng)

1.我有以下需求：
得到貴公司產(chǎn)品詳細資料得到貴公司產(chǎn)品的價(jià)格信息貴公司產(chǎn)品銷(xiāo)售人員聯(lián)系我貴公司技術(shù)支持人員聯(lián)系我
2.詳細的需求：
*
姓名:	*
單位:
電話(huà):	*
郵件:	*

技術(shù)頻道

行業(yè)頻道

熱門(mén)頻道

技術(shù)頻道

行業(yè)頻道

熱門(mén)頻道

資訊頻道

熱點(diǎn)新聞

推薦產(chǎn)品