用戶(hù)的消費習慣、興趣愛(ài)好、關(guān)系網(wǎng)絡(luò )以及整個(gè)互聯(lián)網(wǎng)的趨勢、潮流都將成為互聯(lián)網(wǎng)從業(yè)者關(guān)注的熱點(diǎn),而這一切的獲取和分析都離不開(kāi)大數據。一方面,社會(huì )化媒體基礎上的大數據挖掘和分析將會(huì )衍生很多應用;另一方面,基于數據分析的營(yíng)銷(xiāo)咨詢(xún)服務(wù)也正在興起。
這些專(zhuān)注于數據挖掘和數據服務(wù)的公司將成為電子商務(wù)乃至互聯(lián)網(wǎng)第三方服務(wù)業(yè)中的新興力量。
數據背后潛藏著(zhù)巨大的商業(yè)機會(huì )。以前只有Google、微軟這樣的公司能做大數據的深挖,現在已經(jīng)有越來(lái)越多的創(chuàng )業(yè)公司進(jìn)入,不同公司在不同維度的數據分析和服務(wù)正創(chuàng )造出新的商業(yè)模式。
《爆發(fā)》作者、全球復雜網(wǎng)絡(luò )研究專(zhuān)家巴拉巴西教授表示,一項新的學(xué)術(shù)發(fā)現轉化到商業(yè)模式會(huì )涉及很多的因素和很長(cháng)的時(shí)間,比如社交網(wǎng)絡(luò )理論的提出到Facebook等社交網(wǎng)絡(luò )興起,經(jīng)過(guò)了數十年的時(shí)間。而大數據領(lǐng)域的商業(yè)形態(tài)發(fā)展也會(huì )有這樣的滯后性,但資本市場(chǎng)早就開(kāi)始聚焦于具備數據匯聚以及挖掘分析能力的公司,并開(kāi)始投資大數據挖掘的早期項目。
大數據的價(jià)值
首先,手中握有數據的公司站在金礦上,基于數據交易即可產(chǎn)生很好的效益;其次,基于數據挖掘會(huì )有很多商業(yè)模式誕生。
“假如我們有了一個(gè)數據預報臺,就像為企業(yè)裝上了一個(gè)GPS和雷達,企業(yè)的出海將會(huì )更有把握。”馬云(微博)在2012年網(wǎng)商大會(huì )上的演講中形象地表示了數據的重要性。
谷歌搜索、Facebook的帖子和微博消息使得人們的行為和情緒的細節化測量成為可能。挖掘用戶(hù)的行為習慣和喜好,凌亂紛繁的數據背后找到更符合用戶(hù)興趣和習慣的產(chǎn)品和服務(wù),并對產(chǎn)品和服務(wù)進(jìn)行針對性地調整和優(yōu)化,這就是大數據的價(jià)值。大數據也日益顯現出對各個(gè)行業(yè)的推進(jìn)力。
騰云天下數據挖掘總監張夏天表示,大數據時(shí)代來(lái)臨首先由數據豐富度決定的。社交網(wǎng)絡(luò )興起,大量的UGC(互聯(lián)網(wǎng)術(shù)語(yǔ),全稱(chēng)為User Generated
Content,即用戶(hù)生成內容的意思)內容、音頻、文本信息、視頻、圖片等非結構化數據出現了。另外,物聯(lián)網(wǎng)的數據量更大,加上移動(dòng)互聯(lián)網(wǎng)能更準確、更快地收集用戶(hù)信息,比如位置、生活信息等數據。從數據量來(lái)說(shuō),目前已進(jìn)入大數據時(shí)代,但現在的硬件明顯已跟不上數據發(fā)展的腳步。
以往大數據通常用來(lái)形容一個(gè)公司創(chuàng )造的大量非結構化和半結構化數據,而現在提及“大數據”,通常是指解決問(wèn)題的一種方法,即通過(guò)收集、整理生活中方方面面的數據,并對其進(jìn)行分析挖掘,進(jìn)而從中獲得有價(jià)值信息,最終衍化出一種新的商業(yè)模式。
張夏天告訴記者,雖然大數據目前在國內還處于初級階段,但是商業(yè)價(jià)值已經(jīng)顯現出來(lái)。首先,手中握有數據的公司站在金礦上,基于數據交易即可產(chǎn)生很好的效益;其次,基于數據挖掘會(huì )有很多商業(yè)模式誕生,定位角度不同,或側重數據分析。比如幫企業(yè)做內部數據挖掘,或側重優(yōu)化,幫企業(yè)更精準找到用戶(hù),降低營(yíng)銷(xiāo)成本,提高企業(yè)銷(xiāo)售率,增加利潤。
百分點(diǎn)的聯(lián)合創(chuàng )始人蘇萌表示,未來(lái),數據可能成為最大的交易商品。但數據量大并不能算是大數據,大數據的特征是數據量大、數據種類(lèi)多、非標準化數據的價(jià)值最大化。因此,大數據的價(jià)值是通過(guò)數據共享、交叉復用后獲取最大的數據價(jià)值。在他看來(lái),未來(lái)大數據將會(huì )如基礎設施一樣,有數據提供方、管理者、監管者,數據的交叉復用將大數據變成一大產(chǎn)業(yè)。
據統計,目前大數據所形成的市場(chǎng)規模在51億美元左右,而到2017年,此數據預計會(huì )上漲到530億美元。
大數據已有商業(yè)模式
目前,國內網(wǎng)絡(luò )廣告投放正從傳統的面向群體的營(yíng)銷(xiāo)轉向個(gè)性化營(yíng)銷(xiāo),從流量購買(mǎi)轉向人群購買(mǎi)。
雖然市場(chǎng)大環(huán)境不好,但是具備數據挖掘能力的公司卻倍受資本青睞。
國金證券TMT行業(yè)分析師趙國棟表示,大數據是一個(gè)很好的視角和工具。從資本角度來(lái)看,什么樣的公司有價(jià)值,什么樣的公司沒(méi)有價(jià)值,從其擁有的數據規模、數據的活性和這家公司能運用、解釋數據的能力,就可以看出這家公司的核心競爭力。而這幾個(gè)能力正是資本關(guān)注的點(diǎn)。
移動(dòng)互聯(lián)網(wǎng)與社交網(wǎng)絡(luò )興起將大數據帶入新的征程,互聯(lián)網(wǎng)營(yíng)銷(xiāo)將在行為分析的基礎上向個(gè)性化時(shí)代過(guò)渡。創(chuàng )業(yè)公司應用“大數據”告訴廣告商什么是正確的時(shí)間,誰(shuí)是正確的用戶(hù),什么是應該發(fā)表的正確內容等,這正好切中了廣告商的需求。
獨到科技創(chuàng )始人張文浩認為,社交網(wǎng)絡(luò )產(chǎn)生了海量用戶(hù)以及實(shí)時(shí)和完整的數據,同時(shí)社交網(wǎng)絡(luò )也記錄了用戶(hù)群體的情緒,通過(guò)深入挖掘這些數據來(lái)了解用戶(hù),然后將這些分析后的數據信息推給需要的品牌商家或是微博營(yíng)銷(xiāo)公司。
實(shí)際上,將用戶(hù)群精準細分,直接找到要找的用戶(hù)正是社交內容背后數據挖掘所帶來(lái)的結果。而通過(guò)各種算法實(shí)現的數據信息交易,正是張文浩為自己的社交數據挖掘公司設計的盈利模式。目前,這家僅僅五六個(gè)人的小公司拿到了天使投資。張文浩表示,目前,國內網(wǎng)絡(luò )廣告投放正從傳統的面向群體的營(yíng)銷(xiāo)轉向個(gè)性化營(yíng)銷(xiāo),從流量購買(mǎi)轉向人群購買(mǎi)。未來(lái)的市場(chǎng)將更多地以人為中心,主動(dòng)迎合用戶(hù)需求,前提就是要找到這部分人群。
在移動(dòng)互聯(lián)網(wǎng)領(lǐng)域,北京騰云天下科技有限公司從開(kāi)發(fā)者角度找到數據挖掘的方向,通過(guò)提供免費的技術(shù)服務(wù),幫助開(kāi)發(fā)者了解應用狀況。“對于騰云天下來(lái)說(shuō),服務(wù)的同時(shí)也聚集了數據,盈利方向是為開(kāi)發(fā)者提供更有價(jià)值的信息服務(wù)和增值服務(wù)。”張夏天表示。
大數據的多重挑戰
如何將數據信息與產(chǎn)品和人相結合,達到產(chǎn)品或服務(wù)優(yōu)化是大數據商業(yè)模式延展上的挑戰之一。
伴隨著(zhù)各種隨身設備、物聯(lián)網(wǎng)和云計算云存儲等技術(shù)的發(fā)展,人和物的所有軌跡都可以被記錄。在移動(dòng)互聯(lián)網(wǎng)的核心網(wǎng)絡(luò )節點(diǎn)是人,不再是網(wǎng)頁(yè)。數據大爆炸下,怎樣挖掘這些數據,也面臨著(zhù)技術(shù)與商業(yè)的雙重挑戰。
在中國軟件開(kāi)發(fā)者大會(huì )上,騰訊首席科學(xué)家孫國政表示,“現在我們面臨的挑戰一方面是大數據的存儲處理,更重要的是大數據如何為用戶(hù)、為廣大網(wǎng)民服務(wù)的問(wèn)題。”
首先,如何將數據信息與產(chǎn)品和人相結合,達到產(chǎn)品或服務(wù)優(yōu)化是大數據商業(yè)模式延展上的挑戰之一。張夏天認為,大數據對算法和計算平臺的挑戰加大,計算開(kāi)銷(xiāo)大增??偭可仙?,質(zhì)量下降,這是大數據帶來(lái)的重大挑戰。
其次,巧婦難為無(wú)米之炊,大數據的關(guān)鍵還是在于誰(shuí)先擁有數據。多盟聯(lián)合創(chuàng )始人兼COO張鶴表示,智能手機是根據用戶(hù)營(yíng)銷(xiāo)而不是根據媒體營(yíng)銷(xiāo)。移動(dòng)互聯(lián)網(wǎng)提供了新的數據來(lái)源,數據分析能夠針對每一位用戶(hù)的手機信息做精準匹配,但目前大數據時(shí)代還沒(méi)有真正來(lái)臨。多盟雖然每天可覆蓋1800萬(wàn)用戶(hù),但對用戶(hù)行為的描述,還需要更大的數據量。
從市場(chǎng)角度來(lái)看,大數據還面臨其他因素的挑戰。架勢無(wú)線(xiàn)CEO葉忻直言,大數據很有前景,但是市場(chǎng)中數據噪音太多,會(huì )導致數據價(jià)值大大降低。以無(wú)線(xiàn)營(yíng)銷(xiāo)為例,大量的刷量以及水軍好評差評等數據已經(jīng)嚴重干擾了數據的準確性,這實(shí)際上大大降低了數據的價(jià)值。
電商數據挖掘需要“軍師”
有這樣一個(gè)真實(shí)案例在微博上流傳很廣。
美國一名男子闖入他家附近的Target店鋪(一家美國零售連鎖超市)進(jìn)行抗議:“你們竟然給我17歲的女兒發(fā)嬰兒尿片和童車(chē)的優(yōu)惠券。”店鋪經(jīng)理立刻向來(lái)者致歉,其實(shí)經(jīng)理并不知道這是公司運行大數據系統的結果。一個(gè)月后,這位父親來(lái)道歉,他的女兒的確懷孕了。
這個(gè)故事就是基于數據分析的精準營(yíng)銷(xiāo)的結果。百分點(diǎn)現在做的就是通過(guò)分析用戶(hù)在網(wǎng)絡(luò )上的消費行為數據,幫助電商企業(yè)實(shí)現“千人千面”精準營(yíng)銷(xiāo)。
大數據時(shí)代,營(yíng)銷(xiāo)將會(huì )更多地依賴(lài)數據,從而更精準地找到用戶(hù)。百分百創(chuàng )始人蘇萌表示,根據來(lái)自不同平臺的數據進(jìn)一步挖掘和分析,找到這些數據相對應的人群,再將這些群體進(jìn)行個(gè)性化的對比,并以此展開(kāi)個(gè)性化的營(yíng)銷(xiāo)服務(wù)。例如發(fā)送EDM,或者流量對接,或者跟傳統搜索結合。
“大數據的一個(gè)重要趨勢就是數據服務(wù)變革,針對群體,把人分成很多群體,每個(gè)都給予不同的服務(wù)。”百分點(diǎn)首席科學(xué)家周濤表示,以電子商務(wù)為例,傳統電商推薦,多是使用協(xié)同算法,挖掘不同產(chǎn)品間的關(guān)聯(lián)度。但在百分點(diǎn),這樣的算法已經(jīng)從基礎服務(wù)形式,下沉到推薦引擎框架底層,不直接推薦結果。
蘇萌告訴記者,在數據爆炸的年代,人們經(jīng)常淹沒(méi)在海量商品和資訊之中,不知道自己想要什么。而百分點(diǎn)的數據挖掘正是主要側重于如何找到用戶(hù)需求,以及如何將數據轉化為對客戶(hù)的幫助。
通俗來(lái)講,電商網(wǎng)站通常用的關(guān)聯(lián)規則并不是個(gè)性化算法,比如白酒、花生米兩個(gè)可能對所有用戶(hù)都關(guān)聯(lián)度很高,就會(huì )推薦這兩個(gè)商品。但是個(gè)性推薦,則會(huì )通過(guò)場(chǎng)景和需求來(lái)調動(dòng)不同算法,計算對于個(gè)體真實(shí)的用戶(hù)需求。
個(gè)性化推薦知道用戶(hù)喜歡什么,確實(shí)地提供商品推薦信息,于是就發(fā)揮了“導購”的作用,這無(wú)疑更能刺激購買(mǎi)。對于電商企業(yè)來(lái)說(shuō),在精細化運營(yíng)的趨勢下,無(wú)疑會(huì )為更精準的營(yíng)銷(xiāo)和用戶(hù)重復購買(mǎi)。
以走秀網(wǎng)為例,采用了百分點(diǎn)提供的分析數據后,消費者可以通過(guò)走秀網(wǎng)上的“本月熱銷(xiāo)”(個(gè)性化熱銷(xiāo)榜)、“猜您喜歡的”(個(gè)性化熱覽榜)瀏覽或購買(mǎi)自己感興趣的商品。其個(gè)性化服務(wù)能力大大提高。
蘇萌表示,百分點(diǎn)每天獲取的數據主要分為兩類(lèi),一類(lèi)是內容和商品基礎數據容量,每天大約在TB級的規模;另一類(lèi)是一些關(guān)于合作伙伴網(wǎng)絡(luò )上的行為偏好數據,例如瀏覽過(guò)什么、收藏過(guò)什么、購買(mǎi)過(guò)什么等數據,這部分數據大約達到了GB級的規模。“這兩類(lèi)基本是離消費者最近的數據,可以說(shuō)是電子商務(wù)最核心的數據。”
和線(xiàn)下零售不同的是,電子商務(wù)網(wǎng)站都有非常豐富的顧客歷史數據,包括登錄、點(diǎn)擊、瀏覽以及購買(mǎi)等等。如果你把數據放在地下室讓它們堆滿(mǎn)灰塵,這些數據就是一項負資產(chǎn),它們需要硬件來(lái)存儲,需要人員來(lái)管理,卻沒(méi)有任何使用價(jià)值。
蘇萌表示,在百分點(diǎn)有兩大數據處理平臺,一個(gè)是流處理平臺,另一個(gè)是批處理平臺。前者會(huì )處理一些實(shí)時(shí)性比較高的數據,例如消費者購買(mǎi)意圖或者點(diǎn)擊預估數據。而在批處理平臺上面,更多的是做一些基礎任務(wù),例如全網(wǎng)行為的挖掘分析、BI分析、商務(wù)報表等,會(huì )按照時(shí)間調度來(lái)完成。這兩個(gè)數據平臺,正是個(gè)性化推薦和分析運營(yíng)工具的支撐。
數據服務(wù)前景可期
產(chǎn)業(yè)界對于大數據的熱情持續升溫的同時(shí),資本也敏銳地發(fā)現了這一趨勢,并開(kāi)始關(guān)注數據挖掘和服務(wù)類(lèi)公司?;诖?,《中國經(jīng)營(yíng)報》記者專(zhuān)訪(fǎng)了對這個(gè)領(lǐng)域深有研究的IDG資本合伙人李豐。
《中國經(jīng)營(yíng)報》:現在大數據越來(lái)越多被提及,你覺(jué)得數據挖掘在商業(yè)模式上有什么新的趨勢?
李豐:大數據就是實(shí)時(shí)數據的處理和實(shí)時(shí)結果的導向,越來(lái)越多的數據挖掘前端化,或者說(shuō)直接為消費者感知和直接提供消費者所需要的服務(wù),通常形式是誕生了各種各樣的個(gè)性化推薦的服務(wù)。
《中國經(jīng)營(yíng)報》:在大數據背景下,對于各種從事數據挖掘的公司有什么新的機會(huì )?
李豐:大數據的前提是數據總量的迅速增加以及數據的流動(dòng)性增加,前者是由于用戶(hù)的行為在手機和電腦上越來(lái)越多,門(mén)檻越來(lái)越低;另外一個(gè)因素是因為各種平臺的開(kāi)放導致流動(dòng)性增加,以上兩個(gè)因素的誕生才能催生更多的直接為消費者服務(wù)的大數據公司。以北京百分點(diǎn)信息科技有限公司(以下簡(jiǎn)稱(chēng)“百分點(diǎn)”)為例,這家公司的方向、應用和誕生時(shí)間,恰好符合了這樣的趨勢。
《中國經(jīng)營(yíng)報》:從投資角度,你怎么看數據挖掘類(lèi)公司的投資價(jià)值和公司前景?
李豐:我看好以大數據為出發(fā)點(diǎn)的商業(yè)模式和電商的后續服務(wù)產(chǎn)品。它們的前景大方向是符合趨勢的,但是具體產(chǎn)品和數據處理能力,可能是最終成敗的因素。
《中國經(jīng)營(yíng)報》:從行業(yè)角度看做大數據的門(mén)檻在哪里?做數據挖掘需要具備哪些重要的因素?
李豐:門(mén)檻主要是如何獲得大量數據,數據的質(zhì)量、相關(guān)性以及是否有好的處理能力和技術(shù),最終應用的方向是商業(yè)化的關(guān)鍵。
《中國經(jīng)營(yíng)報》:在你看來(lái),IDG投資百分點(diǎn)主要看中哪幾個(gè)關(guān)鍵點(diǎn)?你認為百分點(diǎn)所處的競爭環(huán)境如何?
李豐:百分點(diǎn)具有良好的團隊、技術(shù)能力、行業(yè)能力以及研究能力,在它們的創(chuàng )始人之間既有互補又有突出。另外,它們的誕生和發(fā)展符合了大的趨勢,而且相對又有一點(diǎn)領(lǐng)先。目前的競爭環(huán)境主要取決于國內互聯(lián)網(wǎng)公司,尤其是大公司對于開(kāi)放數據的態(tài)度和速度,同時(shí)也包括它們的技術(shù)能力和產(chǎn)品是否能夠不斷地超越用戶(hù)的需求。