《經(jīng)濟日報》,2014年3月17日
編者按 作為國家科技創(chuàng )新體系的重要組成部分,國家重點(diǎn)實(shí)驗室是國家組織高水平基礎研究和應用基礎研究、聚集和培養優(yōu)秀科學(xué)家、開(kāi)展高層次學(xué)術(shù)交流的重要基地。自1984年啟動(dòng)國家重點(diǎn)實(shí)驗室建設計劃以來(lái),我國已有約300個(gè)國家重點(diǎn)實(shí)驗室投入運行。這些實(shí)驗室是如何開(kāi)展創(chuàng )新性研究的呢?為此,本報派出記者,走進(jìn)10個(gè)國家重點(diǎn)實(shí)驗室,讓讀者了解它們背后的故事。
模式識別國家重點(diǎn)實(shí)驗室是這組系列采訪(fǎng)的第一站。它籌建于1984年,1987年正式對外開(kāi)放并通過(guò)國家驗收,是首批國家重點(diǎn)實(shí)驗室之一。
打開(kāi)市場(chǎng)大門(mén)
墻上掛著(zhù)一幅畫(huà),有人從墻邊走過(guò),取下畫(huà)框。
嘀嘀嘀!尖利的報警聲響起,監控室的顯示屏上,這幅畫(huà)所在的監控視頻從數十個(gè)視頻中脫穎而出,瞬間被電腦挪至屏幕中心并放大,墻上放置畫(huà)框處被加上了一閃一閃的紅框,畫(huà)框被人取走的那一小段鏡頭被反復重放。
“這可以用于博物館畫(huà)展防盜,是視頻識別技術(shù)在安保領(lǐng)域中的應用。”中科唯實(shí)科技有限公司總經(jīng)理王海濱說(shuō),“我們的核心技術(shù)來(lái)自模式識別國家重點(diǎn)實(shí)驗室。”
隨著(zhù)現代社會(huì )攝像頭的普及,平均一個(gè)市級城市的攝像頭就有2.5萬(wàn)個(gè)以上,海量數據僅靠人力難以監控,必須依靠電腦輔助挖掘,智能視頻分析系統的市場(chǎng)因此越來(lái)越大。“我們競爭的是百億級的市場(chǎng)。”王海濱充滿(mǎn)信心地說(shuō)。
事實(shí)上,在這家公司成立(2012年7月)之前,模式識別國家重點(diǎn)實(shí)驗室的視頻分析與監控技術(shù)就獲得過(guò)國家科技進(jìn)步二等獎,在北京城鐵13號線(xiàn)得到成功應用。13號線(xiàn)自2002年開(kāi)通運營(yíng)以后,電纜線(xiàn)被盜案件時(shí)有發(fā)生。2007年初,城鐵13號線(xiàn)安裝了智能視頻分析系統,對每個(gè)角落進(jìn)行24小時(shí)的實(shí)時(shí)監控,一接到智能系統的報警信號,安保力量就會(huì )及時(shí)出動(dòng)。在幾個(gè)盜賊被當場(chǎng)擒獲之后,城鐵13號線(xiàn)近幾年就再也沒(méi)有發(fā)生過(guò)類(lèi)似案件了。
偷盜、打架?有異常行為分析系統。
公眾場(chǎng)所會(huì )否發(fā)生踩踏?有人群密度監測系統。
電影中用正常視頻替換掉異常視頻的黑客行為怎么防范?有視頻篡改檢測軟件。
想查明星身上的衣服包包哪里賣(mài)?有圖片檢索技術(shù)。
如何擴大市場(chǎng)并精準投放產(chǎn)品?可用電腦分析目標人群的行為偏好和行動(dòng)規律。
……
實(shí)驗室博士張俊格的研究方向就是圖像視頻分析,他對這個(gè)研究方向充滿(mǎn)信心:“模式識別是大數據技術(shù)的核心,十幾年前看不到太多應用,現在應用需求非常大。”
“數據本身沒(méi)價(jià)值,挖掘數據中的模式才有價(jià)值。大數據時(shí)代,模式識別很重要。”中科院院士譚鐵牛表示,幾十年前國家就在這個(gè)方向設立重點(diǎn)實(shí)驗室,具有超前的戰略眼光。
堅持國際水準
模式識別實(shí)驗室的國際范兒很濃厚:早在1997年就成立中法聯(lián)合實(shí)驗室,后來(lái)擴展成中歐聯(lián)合實(shí)驗室;早在2001年就有一位來(lái)此做博士后、后來(lái)成為實(shí)驗室正式員工的法國女士普林特申請到我國的國家基金項目,成為外籍科學(xué)家申請國內科研項目的第一人;有19人次擔任模式識別領(lǐng)域一些重要國際學(xué)術(shù)組織的職位。
頻繁的國際交流與合作,昭示了模式識別實(shí)驗室堅持國際水準的雄心壯志。要建設世界一流實(shí)驗室,“頂天”的國際水準和“立地”的成果應用缺一不可。
虹膜識別,就是實(shí)驗室中非常有代表性的一個(gè)“頂天立地”的技術(shù)。
虹膜是人眼瞳孔和眼白之間的環(huán)狀組織,包含了豐富的紋理信息,是人體中最獨特的結構之一。虹膜識別技術(shù)是目前精確度最高的生物識別技術(shù)。
模式識別國家重點(diǎn)實(shí)驗室的虹膜識別技術(shù)在國際上名列前茅。眼睛半睜,可以識別;戴上美瞳片,可以識別;甚至3米遠看一眼,也能識別……實(shí)驗室的虹膜識別技術(shù)參加國際比賽,連續排名第一。這個(gè)領(lǐng)域最頂尖的刊物上,關(guān)于虹膜識別的文章,近一半出自這個(gè)實(shí)驗室。他們提出了自己的基礎理論,掌握了數據源頭,參與制定國際標準,并有成功的產(chǎn)業(yè)化實(shí)踐。
實(shí)驗室建成的虹膜圖像數據庫是國際上目前規模最大、使用最廣的共享虹膜圖像數據庫,有來(lái)自100多個(gè)國家和地區的8000多個(gè)研究團隊使用。美國國家標準研究院曾在公開(kāi)報告中表示,中科院自動(dòng)化所發(fā)布的虹膜圖像數據庫推動(dòng)了國際虹膜識別研究的發(fā)展。
如今,實(shí)驗室自主研制的人臉識別和虹膜識別技術(shù)已經(jīng)成為國產(chǎn)生物特征識別產(chǎn)品的核心技術(shù)來(lái)源,有11項虹膜識別專(zhuān)利的所有權成功轉讓給北京中科虹霸科技有限公司。在2006年成立這家公司之前,中國虹膜識別的市場(chǎng)都被日本松下、韓國LG壟斷,國產(chǎn)技術(shù)推出之后,打破國外壟斷,產(chǎn)品價(jià)格至少下降了三分之二,中科虹霸公司如今已占據了國內80%以上的虹膜識別市場(chǎng)份額。
實(shí)驗室的虹膜識別技術(shù)不僅占據國內市場(chǎng),還通過(guò)技術(shù)授權在國際上首次大規模實(shí)際應用于銀行ATM機。
寄望基礎創(chuàng )新
如今,實(shí)驗室做出的包括人臉識別和虹膜識別技術(shù)在內的新一代生物特征識別系統,已在奧運會(huì )、世博會(huì )、海關(guān)、銀行、軍隊、公安、煤礦等領(lǐng)域取得實(shí)際應用。
作為國家重點(diǎn)實(shí)驗室,模式識別實(shí)驗室還建立了人臉數據庫(2D和3D)、虹膜數據庫、掌紋數據庫、語(yǔ)音語(yǔ)料數據庫、步態(tài)數據庫、手寫(xiě)文字數據庫等15個(gè)大型數據庫,并免費提供學(xué)術(shù)界共享。這么多數據庫,其實(shí)也反映了模式識別研究領(lǐng)域的復雜性。
作為信息科學(xué)和人工智能的重要組成部分,模式識別牽涉的學(xué)科很多,與數學(xué)、統計學(xué)、心理學(xué)、語(yǔ)言學(xué)、計算機科學(xué)等都有關(guān)系;它研究的對象更多,要讓計算機會(huì )看、會(huì )聽(tīng)、會(huì )說(shuō)、會(huì )思考,就要讓電腦像人腦那樣分析和識別文字、圖像、視頻、音頻……
在如此紛繁的頭緒中,實(shí)驗室的重點(diǎn)發(fā)展方向是什么呢?
剛剛就任模式識別國家重點(diǎn)實(shí)驗室主任的中科院自動(dòng)化所研究員劉成林表示,實(shí)驗室未來(lái)的主要研究領(lǐng)域和研究方向不變,即模式識別基礎、圖像處理與計算機視覺(jué)、語(yǔ)音語(yǔ)言信息處理。“我們在部分方向上,如虹膜識別、文字識別、機器翻譯是領(lǐng)先的,這些我們還將繼續保持。在模式識別基礎理論方面,如機器學(xué)習、視覺(jué)計算基礎等,我們有一些零散的成果,但沒(méi)有形成大的學(xué)術(shù)影響,還需要重點(diǎn)投入力量開(kāi)展原創(chuàng )性研究。”
在模式識別領(lǐng)域,各種識別問(wèn)題的核心都是模式分類(lèi)。目前模式分類(lèi)的基本理論和方法,主要有統計分類(lèi)器、神經(jīng)網(wǎng)絡(luò )、支撐向量機、Boosting、稀疏表示等,這些國際上常用的模式識別理論和方法大多為國外科學(xué)家首先提出。
“新的理論方法有可能提高所有模式識別任務(wù)的準確率,并在國際上產(chǎn)生重大學(xué)術(shù)影響,我們現在缺乏這方面的工作。”劉成林說(shuō),要產(chǎn)生這樣的成果,需要吸引這方面最好的人才,給予穩定的支持。“至少穩定10年以上,就可能出很好的東西。我們考慮將國家重點(diǎn)實(shí)驗室的專(zhuān)項經(jīng)費向基礎理論研究?jì)A斜。”
術(shù)有千變,道法歸一。我們期待著(zhù),模式識別實(shí)驗室能早日實(shí)現基礎理論的突破,實(shí)現電腦與人腦之間的無(wú)縫銜接。