來(lái)源:《經(jīng)濟日報》
顧客走進(jìn)商店,在一貨架前只停留片刻,商家就可以通過(guò)大數據技術(shù),立刻知道該顧客的購買(mǎi)習慣,以及是否購買(mǎi)過(guò)這個(gè)牌子的產(chǎn)品。商家再通過(guò)實(shí)時(shí)分析,確定個(gè)性化營(yíng)銷(xiāo)策略,及時(shí)將優(yōu)惠信息發(fā)送到顧客手機上,以激發(fā)顧客的購買(mǎi)欲望,而商家推廣新產(chǎn)品的效率也得到了提高。
近日,在北京舉辦的2012年Hadoop與大數據技術(shù)大會(huì )上,中科院計算所所長(cháng)孫凝暉認為,在未來(lái)大數據會(huì )成為一個(gè)新的行業(yè),隨著(zhù)更多有價(jià)值的數據從海量數據中被發(fā)掘出來(lái),將會(huì )產(chǎn)生許多新的商業(yè)形態(tài)、新的企業(yè)和新的服務(wù)。
大數據是信息產(chǎn)業(yè)領(lǐng)域內最具發(fā)展潛力的行業(yè),全球IT研究與顧問(wèn)咨詢(xún)公司Gartner數據中心首席分析師張瑾介紹說(shuō),最新研究數據顯示,全球數據量每年至少增長(cháng)59%。大數據將帶來(lái)大量就業(yè)機會(huì )。到2015年,大數據將為全球帶來(lái)440萬(wàn)個(gè)IT崗位,為中國帶來(lái)1萬(wàn)個(gè)技術(shù)職位。
大數據量大且雜。數據源分為兩類(lèi):一類(lèi)是用戶(hù)通過(guò)社交媒體、搜索等用戶(hù)活動(dòng)產(chǎn)生的數據;另一類(lèi)是機器產(chǎn)生的數據。IBM中國研究院信息管理與醫療健康首席科學(xué)家潘越認為,大數據不僅指數據量大,與傳統數據的不同點(diǎn)還在于數據實(shí)時(shí)處理速度要求高,數據形態(tài)呈現多樣性,以及大數據的不確定性。傳統數據分析周期是以月、周、天來(lái)劃分,而大數據時(shí)代的很多分析必須是實(shí)時(shí)作出決策,否則大數據價(jià)值便無(wú)法體現。
在大數據中,有70%至85%的數據是“多種數據混合體”,數據處理的復雜度高,傳統數據有87%的性能問(wèn)題與數據增長(cháng)有關(guān)。數據管理的花費也大,是采購存儲花費的3倍。張瑾介紹說(shuō),目前大數據在普通設備上無(wú)法運行和備份。大數據應該實(shí)現低成本運算和高可用,也就是通過(guò)使用消費級硬件,以及軟件設計、架構設計,來(lái)實(shí)現大數據管理,而不是靠以往采用的高性能、高端設備來(lái)實(shí)現數據存儲。
在大數據處理工具Hadoop上,目前集成了很多行業(yè)應用。一些企業(yè)在大會(huì )上展示了他們在物流、醫療、零售業(yè),以及公共服務(wù)等領(lǐng)域的應用成果。但有專(zhuān)家建議,在實(shí)施“大數據”前,要明確需求和目標,以免因技術(shù)和商業(yè)的不成熟性,給企業(yè)和用戶(hù)帶來(lái)風(fēng)險。