《中國高新技術(shù)產(chǎn)業(yè)導報》,2013年12月23日
12月13日是中關(guān)村大數據日。如果說(shuō)2012年的首個(gè)中關(guān)村大數據日是在“布道”,那么,2013年的大數據日則是在唱一出產(chǎn)業(yè)“大戲”。2500人的會(huì )議室座無(wú)虛席,2013中關(guān)村大數據日匯聚了諸多大數據思想領(lǐng)袖、企業(yè)代表、技術(shù)先鋒和專(zhuān)家學(xué)者,共同探討包羅萬(wàn)象的“大數據+”。觀(guān)風(fēng)聽(tīng)潮,2013中關(guān)村大數據日呈現的不僅是一場(chǎng)業(yè)界關(guān)于大數據的思想激蕩,一種關(guān)于大數據的智慧表達,更呈現了中關(guān)村大數據產(chǎn)業(yè)在潮頭昂首挺立,大步向前的姿態(tài)。
本報記者 張偉報道
思潮篇
大數據:正在發(fā)生的未來(lái)
隨著(zhù)智能終端進(jìn)一步普及,數據采集逐漸多樣,智能分析逐漸成熟,云計算數據存儲和加工后臺開(kāi)始就緒,一個(gè)數據新時(shí)代正在到來(lái)。
“大數據是正在發(fā)生的大事件,下一個(gè)大事件是大數據應用的涌現。”《大數據的云圖》作者、風(fēng)險投資者大衛•芬雷布在2013中關(guān)村大數據日上預言,“下一個(gè)谷歌微軟級別的公司將在大數據領(lǐng)域出現。”
應用驅動(dòng)發(fā)展
“過(guò)去幾年,風(fēng)險投資者主要聚焦于大數據的基礎設施領(lǐng)域;接下來(lái),大數據的應用將獲得重大發(fā)展,從而真正地把數據變成生產(chǎn)力。”大衛•芬雷布認為,大數據的下一個(gè)趨勢是各種關(guān)于大數據的應用不斷涌現,它們將出現在大數據與其他行業(yè)的交叉領(lǐng)域,比如大數據與教育、大數據與健康等。
“今天,一個(gè)嶄新的數據未來(lái)正在發(fā)生。”天云大數據首席執行官雷濤表示,隨著(zhù)數據和計算模型放到了一起、全量的數據融合成了一體、知識發(fā)現的工作成為了基礎工作的一環(huán),大數據實(shí)際上已經(jīng)變成了一種基礎設施。對于企業(yè)來(lái)說(shuō),構建這樣一個(gè)基礎設施已成為完善企業(yè)信息化、探索企業(yè)數據價(jià)值、實(shí)現有競爭力的業(yè)務(wù)創(chuàng )新的根本;對于每個(gè)人來(lái)說(shuō),大數據正在改變人們生活和工作以及社會(huì )生產(chǎn)方式的各個(gè)方面。
醫療領(lǐng)域,越來(lái)越普及的可穿戴智能設備可以隨時(shí)隨地監測人們的身體數據,一場(chǎng)量化自我運動(dòng)正在或者已經(jīng)發(fā)生;每個(gè)人、每家醫院內部、醫院和醫院之間的電子病歷庫正在建立,通過(guò)分析歷史數據,醫生能更有針對性地治療病人,并且可以避免大量的重復檢查。個(gè)性化醫療正在逐漸形成。
金融領(lǐng)域,作為可以產(chǎn)生海量數據的行業(yè),大數據正在改變著(zhù)銀行、證券交易所、股票基金等機構的運作方式。通過(guò)將金融數據與互聯(lián)網(wǎng)數據綜合分析,可以為風(fēng)險管理、金融分析、客戶(hù)價(jià)值挖掘與個(gè)性化定制服務(wù)、保險定制、精準營(yíng)銷(xiāo)等各個(gè)方面提供數據依據,做出正確決策,以減少市場(chǎng)波動(dòng)和不確定因素對金融價(jià)格的影響。
電商領(lǐng)域,可以說(shuō)是目前大數據的主要用武之地,主要表現為精準營(yíng)銷(xiāo)或者個(gè)性化推薦。與過(guò)去相比,現在電商可以采集到更多更全面的用戶(hù)數據,根據用戶(hù)的上網(wǎng)行為、點(diǎn)擊行為和消費行為進(jìn)行數據分析,得出更為精準的分析效果,從而制定更為精準的廣告營(yíng)銷(xiāo),或推出具有客戶(hù)潛在需求的產(chǎn)品,進(jìn)一步擴大用戶(hù)群體及銷(xiāo)售,進(jìn)而收集更多的用戶(hù)數據,形成一個(gè)良性循環(huán)。
除此之外,大數據與交通出行、商業(yè)、制造、教育等傳統行業(yè)都有交叉點(diǎn),并正在改變其運作方式。一個(gè)更加數據化、智能化、個(gè)性化的未來(lái)正在到來(lái)。
公共數據資源待開(kāi)放
大數據時(shí)代的競爭,將是數據資產(chǎn)的競爭。數據資產(chǎn)怎么獲得?這是大數據商用化進(jìn)程中一個(gè)不可回避的問(wèn)題。除了企業(yè)自身的積累乃至付費的購買(mǎi)以外,原先掌握在政府手中的公共數據資源究竟該如何獲得?答案就在“開(kāi)放”二字。
“開(kāi)放公共數據資源,并不等同于免費獲得。”中國計算機學(xué)會(huì )大數據專(zhuān)委會(huì )副秘書(shū)長(cháng)潘柱廷強調,業(yè)界在承認公共數據價(jià)值的同時(shí),應該用價(jià)值規律來(lái)考慮數據的合理使用?;诖?,采用交易的方式來(lái)進(jìn)行數據資源的分享也許更加可行,也更符合經(jīng)濟規律。
“數據的共享要在一定的良性交易規則下進(jìn)行,要盡量在共享和交易之間找到一個(gè)合適的方法。”潘柱廷認為,公共數據資源的開(kāi)放,也需要一定的標準和規范來(lái)加以約束。哪些公共數據資源可以開(kāi)放,如何開(kāi)放?這都是需要深入考慮的問(wèn)題。其中,對于那些涉及信息安全的數據,一定要盡最大可能給予保護;對于那些有可能涉及個(gè)人隱私的數據,要經(jīng)過(guò)處理,例如封裝之后才能開(kāi)放。
“目前政府部門(mén)所掌握的公共數據,能夠開(kāi)放的已經(jīng)在逐步開(kāi)放之中,例如工商數據以及車(chē)輛信息等。” 中關(guān)村管委會(huì )副主任宣鴻表示,“政府有責任推動(dòng)法規、標準,以及數據交易平臺、市場(chǎng)的建立,以推動(dòng)大數據的應用。”
“希望政府將大數據充分運用到醫療、教育、交通等智能城市的建設當中。”太極集團總裁劉淮松、榮之聯(lián)總裁王東輝等企業(yè)界代表在圍繞大數據政策展開(kāi)討論時(shí)強調,大數據不能稱(chēng)之為一個(gè)行業(yè),它植根于各行各業(yè)當中,應利用此特點(diǎn)進(jìn)一步將產(chǎn)業(yè)上下游連接起來(lái),推動(dòng)“數據新世界”早日到來(lái)。
中關(guān)村大數據潮起
大數據是人類(lèi)社會(huì )發(fā)展、科技與產(chǎn)業(yè)創(chuàng )新的一次偉大變革。未來(lái)大數據產(chǎn)業(yè)將成為新科技和產(chǎn)業(yè)革命的重要引擎,孕育著(zhù)巨大的商業(yè)價(jià)值和社會(huì )價(jià)值。有機構預測,2014年全球在大數據和服務(wù)上的開(kāi)支將上漲30%,超過(guò)140億美元。
宣鴻介紹說(shuō),中關(guān)村國家自主創(chuàng )新示范區作為中國的“硅谷”,率先布局大數據產(chǎn)業(yè),并將大數據產(chǎn)業(yè)納入《中關(guān)村戰略性新興產(chǎn)業(yè)集群創(chuàng )新引領(lǐng)工程(2013-2015年)》。2012年,中關(guān)村大數據產(chǎn)業(yè)聯(lián)盟正式成立。同時(shí),2012年中關(guān)村大數據日發(fā)布的云天使基金、中云融匯基金、大數據實(shí)驗室孵化基金三只產(chǎn)業(yè)投資基金經(jīng)過(guò)一年的發(fā)展,已投資和扶持了數音堂、數據聯(lián)英等一批大數據創(chuàng )業(yè)企業(yè)。
“中關(guān)村是我國大數據企業(yè)聚集地和全球大數據創(chuàng )新創(chuàng )業(yè)的熱土,聚集了百度、京東、用友、浪潮、神州數碼、高德軟件等百余家國內龍頭企業(yè),并實(shí)現了持續快速發(fā)展。”據宣鴻介紹,目前中關(guān)村大數據和移動(dòng)互聯(lián)網(wǎng)產(chǎn)業(yè)的收入規模超過(guò)5000億元。來(lái)自硅谷等地區的留學(xué)人員在中關(guān)村創(chuàng )辦的企業(yè)已經(jīng)累計超過(guò)6000家。
宣鴻表示,中關(guān)村已經(jīng)逐步形成了與硅谷同步發(fā)展的大數據創(chuàng )新生態(tài),大量的天使投資人和創(chuàng )業(yè)投資機構瞄準大數據創(chuàng )業(yè)者,每年發(fā)生的創(chuàng )投案例和金額都占到全國的1/3,其中近80%投資在信息技術(shù)領(lǐng)域。
談到中關(guān)村大數據產(chǎn)業(yè)的未來(lái),宣鴻表示,將進(jìn)一步鼓勵全球大數據研究機構和創(chuàng )業(yè)者到中關(guān)村開(kāi)展創(chuàng )新活動(dòng);培育一大批大數據應用服務(wù),打造大數據產(chǎn)業(yè)鏈和創(chuàng )新鏈;推動(dòng)完善云計算和數據中心軟硬件設施的建設,將中關(guān)村打造成為全球大數據產(chǎn)業(yè)人才、技術(shù)、資本等創(chuàng )新要素和數據資源的匯聚地和全球大數據產(chǎn)業(yè)的重要創(chuàng )新中心。
案例篇
紛起的中關(guān)村大數據應用讓生活別樣精彩
大數據,讓城市智慧起來(lái)
12月10日晚,中央電視臺《新聞聯(lián)播》播發(fā)了一條智慧城市的新聞《借助大數據城市更“智慧”》,展示了張家港市建設市民服務(wù)中心,通過(guò)大數據技術(shù)的支撐,實(shí)現部門(mén)之間數據庫信息的互聯(lián)互通,實(shí)現城市的智慧管理。該平臺的開(kāi)發(fā)單位就是中關(guān)村企業(yè)——神州數碼控股有限公司。
神州數碼相關(guān)負責人介紹,城市公共信息服務(wù)平臺就是立足城市,充分利用新一代信息技術(shù),在解決當前各類(lèi)問(wèn)題的同時(shí),能夠構建一套融合創(chuàng )新的機制,保障城市的健康可持續發(fā)展。
為此,神州數碼構建了一套獨有的“城市虛擬映像”體系。該公司相關(guān)負責人說(shuō),通過(guò)這個(gè)“城市虛擬映像”,可以將針對每個(gè)主體的應用服務(wù)抽取出來(lái),形成對現實(shí)世界的服務(wù)。那么,如何構建“城市虛擬映像”?首先要抽取出城市的“主體”,比如市民是城市的一個(gè)重要主體,市民是一個(gè)自然人,圍繞自然人的各種要素抽取,建立一個(gè)“數字人”的模型,并通過(guò)從現實(shí)世界獲取的各項針對這個(gè)人的非結構化數據,進(jìn)行數據清洗、關(guān)鍵數據抽取,形成一個(gè)人的數字映像關(guān)系,從而實(shí)現非結構化數據的重組。針對現實(shí)的各項城市公共服務(wù),就是在城市虛擬映像中形成的。
在“城市虛擬映像”的架構體系下,神州數碼完成了智慧城市公共信息服務(wù)平臺的構建。目前公共信息服務(wù)平臺2.0版包含了市民融合服務(wù)平臺、企業(yè)融合服務(wù)平臺和城市管理服務(wù)平臺3個(gè)平臺。
大數據,助力傳統產(chǎn)業(yè)升級
大數據這一“新式裝備”如何提升傳統產(chǎn)業(yè),如何助推企業(yè)轉型升級?大數據的利用隨處可見(jiàn)。比如,水產(chǎn)養殖業(yè),可通過(guò)分析大量傳感器、環(huán)境、市場(chǎng)、客戶(hù)數據,逐步實(shí)現水產(chǎn)養殖的自動(dòng)控制,并進(jìn)一步指導市場(chǎng)營(yíng)銷(xiāo)和產(chǎn)業(yè)布局等。
中關(guān)村管理軟件企業(yè)用友軟件公司相關(guān)負責人認為,對傳統企業(yè)來(lái)說(shuō),大數據的思想和技術(shù)對企業(yè)的管理提升具有更多的現實(shí)指導意義,大數據在傳統企業(yè)的應用中體現更多的是催生出一些新的工作模式、商業(yè)模式和新型的企業(yè)文化。
目前,用友軟件已經(jīng)與很多傳統企業(yè)合作,助推企業(yè)轉型升級。例如,用友軟件為某大型燃氣公司搭建集成平臺,解決了該企業(yè)子公司多、無(wú)法集中管理等多重問(wèn)題,為企業(yè)建立了全新的、系統的一體化平臺。再比如,采集銷(xiāo)售客戶(hù)數據用于指導市場(chǎng)營(yíng)銷(xiāo)策略規劃;將員工對產(chǎn)品的評論意見(jiàn)進(jìn)行爬蟲(chóng)搜索、分類(lèi)整理和分析,用來(lái)指導新一代產(chǎn)品設計;利用歷史銷(xiāo)售數據整體進(jìn)行產(chǎn)品系列結構和配比模擬分析,結合客戶(hù)購買(mǎi)行為統計分析產(chǎn)品的銷(xiāo)售組合頻率,進(jìn)行相應的產(chǎn)品捆綁組合促銷(xiāo)策略制定。
此外,用友軟件還為中國郵政儲蓄銀行建立起體系先進(jìn)、數據集中、監管完善的管理系統,所有數據在財務(wù)管理系統中生成全行的報表和一本賬,搭建起全國大總賬,幫助銀行實(shí)現精細化、規范化、科學(xué)化管理的經(jīng)營(yíng)發(fā)展戰略。
大數據,讓交通盡在掌握
上班下班、出行游玩……交通成為人們不得不面對的問(wèn)題,尤其是在北京、上海這樣的特大城市。大數據是如何應用于交通的?中關(guān)村交通信息領(lǐng)軍企業(yè)高德軟件有限公司提供了一套解決方案助力智能交通。
如果你想開(kāi)車(chē)出門(mén),但卻擔心交通狀況,怎么辦?高德推出了一個(gè)系統——全平臺的路況趨勢預測查詢(xún),可以幫你預測路況,也可以幫你規劃更加合理的出行路線(xiàn),以規避擁堵,而且該系統會(huì )給出到達目的地的預計時(shí)間。如果你已經(jīng)出門(mén)了卻不知道前方路況怎樣,高德的新應用“前方路況播報”可以告訴你,你可以根據情況及時(shí)更改路線(xiàn)或做其他打算,省去不少麻煩。
為了更好地進(jìn)行交通數據挖掘,分析個(gè)人出行的影響因素,高德推出了“基于大數據的道路速度海量通數據擬合”,將每條道路的歷史碎片速度信息記錄、存儲,通過(guò)進(jìn)一步挖掘,為大數據技術(shù)實(shí)現交通預測和路徑規劃提供了依據和積累。
高德利用大數據這一利器,為公眾提供個(gè)性化的出行服務(wù),以用戶(hù)大數據為驅動(dòng),達到改善產(chǎn)品體驗的目的。高德軟件相關(guān)負責人介紹,高德為公眾提供的服務(wù)可以歸納為通過(guò)對海量數據的實(shí)時(shí)分析處理,高頻度、高精度地發(fā)布城市交通路況,提供最真實(shí)的交通狀況;同時(shí)高德還在為改善城市交通管理水平、制定交通策略、宏觀(guān)交通決策提供依據而努力。
大數據,保障公共安全
3秒鐘鎖定嫌犯,這聽(tīng)起來(lái)不可思議。但大數據應用于公共安全領(lǐng)域讓這成為可能。
乘坐同一班列車(chē),住同一酒店的兩個(gè)人可能是同伙,刑偵人員將不同線(xiàn)索拼湊起來(lái)排查疑犯——來(lái)自于多源數據的處理在傳統架構上需要數小時(shí)甚至整日,而在北京亦莊云基地建立的天云大數據平臺將這一操作縮短至3秒,同時(shí)描述出疑犯的交往關(guān)系。公安人員可以基于計算出的線(xiàn)索盡快鎖定目標。
在公安機關(guān)的日常工作中,有大量的查詢(xún)需求,尤其是實(shí)戰中,各地各部門(mén)迫切要求實(shí)現跨地區、跨部門(mén)的信息快速查詢(xún),需要獲得及時(shí)、全面、準確的信息支持,進(jìn)而實(shí)現統計分析和關(guān)聯(lián)綜合利用。
如今,警務(wù)信息化正步入建設階段,公安“大情報系統”建設與應用可以將警務(wù)管理建立在動(dòng)態(tài)的收集、分析、測繪犯罪信息的基礎上,實(shí)現預防和打擊犯罪的目的,其中精準的情報是基礎、有效的戰術(shù)是手段、警力及相關(guān)資源是保障。
大數據,服務(wù)金融創(chuàng )新
有媒體報道說(shuō),以數據分析幫助供應鏈中的小企業(yè)拿到銀行的信用貸款,金電聯(lián)行不小心撬動(dòng)了中國的中小企業(yè)信貸革命。
中關(guān)村企業(yè)金電聯(lián)行(北京)信息技術(shù)有限公司將大數據應用于金融創(chuàng )新,基于大數據與云計算技術(shù)創(chuàng )建了“客觀(guān)信用評價(jià)體系”,技術(shù)載體為“數據挖掘機器人信用信息云服務(wù)平臺”,其金融創(chuàng )新業(yè)務(wù)集中體現在“大數據信用”。
“客觀(guān)信用評價(jià)體系”通過(guò)植入云端機器人對被評主體網(wǎng)狀與線(xiàn)性的海量、高速、多樣、易變的客觀(guān)信息,進(jìn)行全自動(dòng)、全天候的挖掘、分析與評價(jià),提供非主觀(guān)的全計算性信用結果與實(shí)時(shí)的跟蹤評價(jià),從而實(shí)現采集信息、運用數據、過(guò)程分析、評價(jià)結果和風(fēng)險預警的客觀(guān)性、智能性和高效性。評估后會(huì )得出各個(gè)模塊的子因素評價(jià)結果,形成針對中小企業(yè)的信用分析報告。
“數據挖掘機器人信用信息云服務(wù)平臺”的數據采集模塊由“數據挖掘機器人”完成,數據分析模塊由“客觀(guān)信用評估體系”完成,并可以實(shí)現數據實(shí)時(shí)更新以完成追蹤監管。
通過(guò)“客觀(guān)信用評估體系”對企業(yè)信用做出分級和評價(jià),可供銀行等金融機構作為授信的依據,使企業(yè)得到無(wú)抵質(zhì)押、無(wú)擔保的信用貸款。
大數據信用是大數據與云技術(shù)在信用領(lǐng)域的一種創(chuàng )新性應用,它從認識上改變人們對信用的傳統觀(guān)念與信用評價(jià)思維,從模式上突破金融市場(chǎng)以抵質(zhì)押和擔保貸款為主的傳統方式,以及我國社會(huì )信用體系建設中信用信息采集難、辨偽難、評價(jià)難、跟蹤難等困境,從一誕生就開(kāi)始引發(fā)經(jīng)濟與社會(huì )效應。
大數據,預測電影票房
大數據可以預測交通路況,同樣可以預測電影票房。新影數訊iFilm+利用社交網(wǎng)絡(luò )和數據挖掘預測票房,準確率可達85%。
2012年下半年電影《1942》上映前夕,外界對這部電影一片贊譽(yù)并看好,紛紛預測票房將突破7億元,新影數訊創(chuàng )始人劉晗卻在外出休假前發(fā)布了一條微博,斷言《1942》的票房不會(huì )超過(guò)4億元。電影的制片方甚至前來(lái)質(zhì)詢(xún):“你是哪個(gè)競爭對手派來(lái)‘黑’我們的?”
電影上映后,劉晗的預測得到了印證?!?942》的票房最終收于3.6億元左右。這一預測結果究竟從何而來(lái)?劉晗首先確定出影響票房的幾個(gè)變量,如演員、檔期、上映時(shí)間、首映地等,接著(zhù)就要推算出公式中的定量,他的做法是從1990年以來(lái)上映的電影中抽樣出四五百部,從統計年鑒中查到數據,然后讓計算機逆向推導出定量,從而確定公式。預測時(shí)再把社交網(wǎng)絡(luò )中反映出的變量填入公式后進(jìn)行測算。
新影數訊每天處理上億條社交網(wǎng)站上網(wǎng)友對電影的評價(jià)信息、娛樂(lè )新聞等,每個(gè)季度都要追加新的服務(wù)器和硬盤(pán)以應對暴增的數據處理量,嚴格說(shuō)來(lái),他們賺的是數據的錢(qián)。不僅如此,新影數訊的另一個(gè)業(yè)務(wù)更前衛——為挑選演員甚至導演給出“數字上的建議”。如今,新影數訊已經(jīng)和十幾家影視公司合作,為萬(wàn)達娛樂(lè )、華策影視、小馬奔騰、光線(xiàn)傳媒等娛樂(lè )企業(yè)做營(yíng)銷(xiāo)策略咨詢(xún),更有香港、好萊塢的電影公司上門(mén)找他們做數據測算。新影數訊也獲得了海銀資本的投資,成為中關(guān)村雛鷹人才基地的一員。
大數據,讓搜索更容易
對于搜索大家并不陌生,中關(guān)村企業(yè)百度公司可謂是搜索引擎的龍頭老大。而這里要說(shuō)的是另一家企業(yè)——北京拓爾思信息技術(shù)股份有限公司。
拓爾思憑借非結構化數據管理方面和海量信息處理方面的突出優(yōu)勢,推出了“平臺+行業(yè)解決方案+服務(wù)”的綜合產(chǎn)品線(xiàn),把海量非結構化信息處理技術(shù)和Hadoop架構進(jìn)行有效集成,結合企業(yè)在大數據采集、管理、分析挖掘、可視化方面的具體需求,針對企業(yè)數據、機器數據、社會(huì )化數據,以TRS海貝大數據管理系統為平臺支撐,推出了TRS機器數據挖掘引擎、TRS社會(huì )媒體分析云服務(wù)和TRS大數據一體機等相關(guān)產(chǎn)品和全面的解決方案,滿(mǎn)足政府和企業(yè)在大數據時(shí)代對數據分析、管理的新需求。