編者按:“三分技術(shù)、七分數據,得數據者得天下”,作為最新最熱的技術(shù)話(huà)題,大數據受到各行業(yè)的廣泛關(guān)注。而其在石化行業(yè)的應用,更是業(yè)內的熱門(mén)話(huà)題。
事實(shí)上,大數據在石化行業(yè)并不是什么新鮮的詞匯?,F如今,面對節能的挑戰、新能源的發(fā)展、兩化融合等多項問(wèn)題,石化行業(yè)必須通過(guò)大數據的創(chuàng )新與應用來(lái)應對挑戰,通過(guò)大數據分析,完成相關(guān)信息采集,并對數據進(jìn)行存儲、檢索和智能分析,從數據深度關(guān)聯(lián)、可視化查詢(xún)、數據報告等多個(gè)方向,為石化企業(yè)實(shí)現企業(yè)決策、生產(chǎn)管理的智能化提供數據支持。
當前,涉及數據的行業(yè)越來(lái)越廣,數據種類(lèi)越來(lái)越多,數據量越來(lái)越大,使人們逐漸意識到數據蘊藏的巨大財富和商機。
近年來(lái),“大數據”一詞在各種媒體上頻頻出現,而且越來(lái)越被人們所重視。其實(shí),大數據問(wèn)題早就存在了。
對于現代企業(yè),采集生產(chǎn)和經(jīng)營(yíng)過(guò)程中形成的數據,分析這些數據,由此產(chǎn)生一系列的決策對過(guò)程進(jìn)行干預和調整,這是現代工業(yè)管理所遵循的基本原則。石化行業(yè)早就重視生產(chǎn)經(jīng)營(yíng)活動(dòng)中的數據采集和分析,隨著(zhù)計算機技術(shù)的成熟和普及,數據采集越來(lái)越密集,范圍越來(lái)越廣,數據越來(lái)越多。例如,乙烯生產(chǎn)裝置需要監控的參數約5000余點(diǎn),一個(gè)中等規模的石化企業(yè)需要監控的生產(chǎn)參數約10萬(wàn)點(diǎn),DCS或SCADA系統的采樣周期為秒級,實(shí)時(shí)數據庫保存數據的周期通常為1分鐘,如此算來(lái),一個(gè)星期內,中型石化企業(yè)實(shí)時(shí)數據庫累積的生產(chǎn)參數即可達10億條。作為石化產(chǎn)業(yè)鏈上游的石油勘探也是如此,一個(gè)普通的油田勘探項目即可產(chǎn)生十幾個(gè)TB的地震勘探數據,勘探公司每年的勘探數據量達1500個(gè)TB(一個(gè)TB為十的十二次方字節)。數據量之大可見(jiàn)一斑,由此可見(jiàn),對于石化業(yè)來(lái)說(shuō),大數據問(wèn)題早就有之。
大數據涉及行業(yè)廣泛
隨著(zhù)IT技術(shù)和互聯(lián)網(wǎng)的迅速發(fā)展,各行各業(yè)都在與各種數據打交道,就連普通百姓也在使用數據、產(chǎn)生數據,這些數據又被人們收集、儲存和分析。例如,人們在互聯(lián)網(wǎng)上產(chǎn)生數量巨大的各類(lèi)數據,據統計,社交網(wǎng)站Facebook每天更新的信息量達5000萬(wàn)條,微博Twitter每天刷新的信息約6500萬(wàn)條,這里的數據除了傳統的數字之外,還包括文本、圖形、圖像、聲音等其它形式的數據。
當前,涉及數據的行業(yè)越來(lái)越廣,數據種類(lèi)越來(lái)越多,數據量越來(lái)越大,使人們逐漸意識到數據蘊藏的巨大財富和商機。2011年5月,麥肯錫全球研究院發(fā)布了題為《大數據:創(chuàng )新、競爭和生產(chǎn)力的下一個(gè)新領(lǐng)域》的報告。報告指出,數據已經(jīng)滲透到每個(gè)行業(yè)和業(yè)務(wù)領(lǐng)域,逐漸成為一種重要的生產(chǎn)因素,人們對于大數據的運用預示著(zhù)新一波生產(chǎn)率增長(cháng)浪潮的到來(lái)。2012年3月,美國政府宣布“大數據研究和發(fā)展倡議”,并斥資啟動(dòng)大數據研究和發(fā)展計劃。大數據上升為國家意志,大數據被認為是“未來(lái)的新石油”。
如何迎接大數據的挑戰
提出大數據已有幾年了,如今人們對數據的認識更加深刻,認為大數據的提出正在醞釀和促進(jìn)一場(chǎng)工業(yè)革新,應該采取對策,制定措施,迎接大數據的挑戰。2013年3月,中國電機工程學(xué)會(huì )信息化專(zhuān)委會(huì )發(fā)布《中國電力大數據發(fā)展白皮書(shū)》,該文件分析了電力大數據特征和大數據發(fā)展的挑戰;提出了電力大數據關(guān)鍵技術(shù),以及電力大數據發(fā)展策略;指出了電力大數據是電力工業(yè)技術(shù)革新的必然過(guò)程,以及重塑電力核心價(jià)值和轉變電力發(fā)展方式是中國電力大數據的兩條核心主線(xiàn);展望了大數據的應用前景。其他行業(yè)也都在根據自身特點(diǎn)制定相應對策。
石化行業(yè)有重視數據的傳統,例如,在企業(yè)的控制、執行和管理三個(gè)層面上分別設置數據收集、儲存和處理的機制和相應設備,許多企業(yè)正在或已經(jīng)建立了MES和ERP信息系統。但是,目前數據處理和應用僅僅限于統計和查詢(xún),數據中蘊含的潛在價(jià)值遠遠沒(méi)有被挖掘出來(lái)。隨著(zhù)數據量的不斷增長(cháng),數據的大容量?jì)Υ?、管理和數據安全性?wèn)題,以及隨著(zhù)企業(yè)在更大范圍的布局而產(chǎn)生的分散分布與數據集成之間的矛盾等,這些問(wèn)題均給我們提出了新的課題。正如麥肯錫全球研究院在其分析報告中指出的那樣:大數據是一定時(shí)間內無(wú)法用傳統數據庫軟件工具對其內容進(jìn)行抓取、管理和處理的數據集合。傳統的數據處理模式不能解決大數據問(wèn)題,我們必須在大數據背景下重新審視對數據的認識,梳理出石化行業(yè)大數據的特點(diǎn),關(guān)鍵技術(shù)和應對策略。
首先,我們應從兩個(gè)方面來(lái)認識大數據,即:大數據既是一種新資源,又是一種新的商業(yè)模式。
如同石油、鐵、煤等自然礦物一樣,大數據也是一種重要資源,需要勘探、采掘、提煉等一系列步驟才能加工成有用的物質(zhì),轉化成財富。對數據的統計查詢(xún)只能從數據中提取一些信息,而從數據中獲取更有價(jià)值的知識就需要用數據挖掘、機器學(xué)習等非傳統的數據處理方法。數據、信息、知識是人們描述和認識世界的三個(gè)不同境界。數據只是記錄客觀(guān)事物的符號,只是一種資源;數據只有與某事物聯(lián)系才能有意義,成為有用的信息;知識是描述事物的某個(gè)客觀(guān)規律,反映深層次的本質(zhì)屬性,需要從數據中提煉。我們從大數據中要獲取的不光是信息,更要獲取的是知識,猶如從礦石中提煉出寶貴的金屬。對于大數據的資源屬性而言,除了數據分析方法之外,大數據設備同樣面臨許多新問(wèn)題。
所謂大數據是一種新的商業(yè)模式是指:由于從大數據中發(fā)現有價(jià)值的結果,使人們突破傳統的思維,產(chǎn)生更多的增值服務(wù),催生新的管理模式,拓展新的業(yè)務(wù)領(lǐng)域,轉變原有的發(fā)展方式,引發(fā)技術(shù)創(chuàng )新和產(chǎn)業(yè)革新,甚至改變傳統的社會(huì )管理模式。正如牛津大學(xué)教授維克托說(shuō)的那樣:大數據開(kāi)啟了一次重大的時(shí)代轉型,無(wú)論是商業(yè)、思維還是管理,都無(wú)時(shí)無(wú)刻不在受到數據的影響和改變??傊?,根據大數據的特點(diǎn)需要改變和設計企業(yè)的管理模式??梢栽O想,在不久的將來(lái)企業(yè)將設置大數據分析部門(mén),他們專(zhuān)門(mén)分析企業(yè)內部和周邊相關(guān)的數據,從中發(fā)現問(wèn)題,洞察形勢,預測未來(lái),并將這些結果分發(fā)給相關(guān)人員,及時(shí)作出相應決策。實(shí)際上,電商已經(jīng)在應用大數據技術(shù)轉變其銷(xiāo)售方式,他們從互聯(lián)網(wǎng)數據中獲取客戶(hù)的需求信息,根據客戶(hù)需要主動(dòng)將相關(guān)信息推送到客戶(hù)端,做到有的放矢,提高了銷(xiāo)售效率。
我們還應該改變傳統的數據分析方法,注重應用大數據分析方法。數理統計學(xué)是傳統數據分析方法的理論基礎,統計分析主要包括描述性分析,相關(guān)性分析和回歸分析等,數理統計基于來(lái)自對象的少數樣本分析來(lái)推斷總體。大數據不再是少數樣本,而是對象的全體,使人們有機會(huì )俯視總體,而無(wú)需通過(guò)樣本來(lái)窺視對象。對于龐大的數據體,大數據分析常常采用聚類(lèi)分析、分類(lèi)分析、模式分析、關(guān)聯(lián)分析等分析手段,從中發(fā)現感興趣的,重要的,或異常的模式,而不必拘泥于追求尋找變量之間精確的函數表達式。實(shí)際上,石化生產(chǎn)過(guò)程是復雜的物理化學(xué)變化過(guò)程,影響過(guò)程的因素多,機理十分復雜,難以用線(xiàn)性手段描述和精確方程表達。通過(guò)大數據分析,可以從中發(fā)現某些異常,或事故模式,對安全生產(chǎn)具有重大意義。大數據分析同樣可以用于優(yōu)化生產(chǎn),以及企業(yè)管理的各個(gè)領(lǐng)域。與傳統數據分析相比,大數據技術(shù)注重關(guān)聯(lián)性分析,大數據使我們在更大的范圍內,在眾多的因素中研究事物之間的關(guān)聯(lián)性,會(huì )發(fā)現一些有價(jià)值的新現象和新規律,而傳統數據分析方法限于某個(gè)局部,造成了數據之間的斷裂,數據中的規律無(wú)法充分挖掘。傳統數據分析方法強調事物之間的因果關(guān)系,而大數據分析只強調業(yè)已存在的關(guān)聯(lián)性,無(wú)需探究誰(shuí)是因,誰(shuí)是果??傊?,大數據將帶來(lái)全新的分析問(wèn)題思路和視角。
為了迎接大數據時(shí)代的到來(lái),石化企業(yè)應該切實(shí)做好技術(shù)改造,技術(shù)儲備和技術(shù)攻關(guān),特別在以下幾個(gè)方面:數據管理上,建立大數據管理體系和架構,大數據的軟、硬件平臺;數據分析上,研究數據挖掘、機器學(xué)習、模式識別等新分析方法的應用;數據處理上,研究分布計算式和儲存技術(shù),云計算技術(shù)等;數據展現上,研究如何生動(dòng)展示數據和數據分析結果,如可視化,三維和虛擬現實(shí)等技術(shù);人才培養上,盡快培養解決大數據問(wèn)題的技術(shù)人才。
作者簡(jiǎn)介
陸治榮,畢業(yè)于清華大學(xué)工程數學(xué)力學(xué)系,曾在航天二院、南京煉油廠(chǎng)、霍尼韋爾公司高技術(shù)執行部,思華數據技術(shù)有限公司,北京石油化工工程有限公司等單位工作。近十余年,專(zhuān)注于數據挖掘和數據分析技術(shù)的研究、開(kāi)發(fā)和應用,期間,主持了兩項數據分析軟件的研發(fā),獲發(fā)明專(zhuān)利一項,出版專(zhuān)著(zhù)一部。
摘自《自動(dòng)化博覽》2月刊