鄔賀銓
■本報記者 陸琦
“大數據挖掘對智慧城市的經(jīng)濟發(fā)展和社會(huì )管理是無(wú)形的生產(chǎn)資料,大數據價(jià)值的合理共享和利用將創(chuàng )造巨大財富。”中國工程院院士鄔賀銓在1月11日舉行的2013中國智慧城市年會(huì )上說(shuō)。
鄔賀銓認為,智慧城市是城鎮化進(jìn)程的下一階段,是城市信息化的新高度,是現代城市發(fā)展的愿景。智慧城市在產(chǎn)生大數據的同時(shí),大數據也支撐著(zhù)智慧城市的建設和發(fā)展。
何謂大數據?鄔賀銓援引維基百科的定義說(shuō),大數據指沒(méi)有辦法在允許的時(shí)間里用常規的軟件工具對內容進(jìn)行抓取、管理和處理的數據集合。
大數據目前的標準是,單一數據集的大小在幾十個(gè)TB(萬(wàn)億字節)和幾個(gè)PB(千萬(wàn)億字節)之間。
大數據究竟有多大?比如,淘寶網(wǎng)每天交易達數千萬(wàn)筆,其單日數據產(chǎn)生量超過(guò)50TB,存儲量超過(guò)40PB;百度每天大約要處理60億次搜索請求,數據量達到幾十PB;中國聯(lián)通用戶(hù)上網(wǎng)記錄達每秒83萬(wàn)條,即每月1萬(wàn)億條,對應數據量為每月300TB。
“大數據雖然孕育于信息通信技術(shù)的日漸普遍和成熟,但它對經(jīng)濟社會(huì )生活產(chǎn)生的影響絕不僅限于技術(shù)層面。”
鄔賀銓舉了幾個(gè)有趣的例子。美國印第安納大學(xué)利用谷歌提供的心情分析工具,從網(wǎng)民的上千萬(wàn)條留言中分類(lèi)出6種心情,進(jìn)而對道瓊斯工業(yè)指數的變化進(jìn)行預測,準確率達到87%。又如,美國Target超市選出孕婦常常購買(mǎi)的25種典型商品,建立“懷孕預測指數”,針對性地派送孕婦用品優(yōu)惠廣告,正因為利用了大數據分析技術(shù)來(lái)細分客戶(hù)群,2002年到2010年間,其銷(xiāo)售額從440億美元增長(cháng)到670億美元。
此外,利用搜索關(guān)鍵詞,疾控部門(mén)可以預測、判斷某地流感暴發(fā)情況;通過(guò)關(guān)注社交網(wǎng)絡(luò )上“糖友”的交流與感悟,醫院和醫生可以獲得更好的糖尿病診療和康復經(jīng)驗……鄔賀銓表示,大數據的應用領(lǐng)域很廣泛,在醫療健康、財務(wù)管理、物流管理、國土安全等各個(gè)領(lǐng)域都有巨大的利用空間。
“物聯(lián)網(wǎng)也好,智慧城市也好,數據挖掘是重點(diǎn)。”鄔賀銓說(shuō),“獲得數據后,不是簡(jiǎn)單的數據分析,還需要建立模型進(jìn)行仿真,得出直觀(guān)的可視化結果。”
鄔賀銓以太湖藍藻監測為例指出,通過(guò)傳感器捕獲太湖水質(zhì)情況,可以得到溶解氧、水溫、電導率、氨氮、pH值等參數作為參考。但僅僅這些還不夠,還需要結合視頻圖像、人工采集和衛星遙感的數據一起分析。“多源異構的數據才能保證判斷的可靠性。”鄔賀銓說(shuō)。
收集到各類(lèi)數據之后,到后臺進(jìn)行分析挖掘,建立模型,跟歷史數據進(jìn)行對比,同時(shí)利用3S技術(shù)、云計算等,最終實(shí)現對污染的處理。
“裝幾十萬(wàn)個(gè)攝像頭,并不表示就是智慧城市。”鄔賀銓直言,“大數據的收集、存儲、分析處理及使用,對智慧城市是很大的挑戰。這不僅是技術(shù)也是政策和法律需要關(guān)注的問(wèn)題。”
鄔賀銓說(shuō),無(wú)線(xiàn)城市、數字城市、寬帶城市、感知城市都是智慧城市的必要條件,創(chuàng )新城市、綠色城市、宜居城市、平安城市、健康城市、幸福城市等更是智慧城市的應有之義。
《中國科學(xué)報》 (2013-01-17 第1版 要聞)