• <blockquote id="fficu"><optgroup id="fficu"></optgroup></blockquote>

    <table id="fficu"></table>

    <sup id="fficu"></sup>
    <output id="fficu"></output>
    1. 20240703
      關(guān)注中國自動(dòng)化產(chǎn)業(yè)發(fā)展的先行者!
      工業(yè)智能邊緣計算2024年會(huì )
      2024
      2024中國自動(dòng)化產(chǎn)業(yè)年會(huì )
      2023年工業(yè)安全大會(huì )
      OICT公益講堂
      當前位置:首頁(yè) >> 資訊 >> 行業(yè)資訊

      資訊頻道

      工業(yè)互聯(lián)網(wǎng)中時(shí)序數據處理面臨的新挑戰
      • 點(diǎn)擊數:4083     發(fā)布時(shí)間:2019-06-06 14:06:00
      • 分享到:
      從行業(yè)需求入手,分析如何通過(guò)新老技術(shù)的融合來(lái)解決傳統技術(shù)架構存在的問(wèn)題,以適應工業(yè)互聯(lián)網(wǎng)新時(shí)期的需求;對時(shí)序數據庫今后的發(fā)展趨勢進(jìn)行了研究,并對新技術(shù)在工業(yè)互聯(lián)網(wǎng)領(lǐng)域的應用提出一些通用的要求,為后續工業(yè)互聯(lián)網(wǎng)基礎技術(shù)的應用和發(fā)展打下理論基礎。
      關(guān)鍵詞:

      導讀

      從行業(yè)需求入手,分析如何通過(guò)新老技術(shù)的融合來(lái)解決傳統技術(shù)架構存在的問(wèn)題,以適應工業(yè)互聯(lián)網(wǎng)新時(shí)期的需求;對時(shí)序數據庫今后的發(fā)展趨勢進(jìn)行了研究,并對新技術(shù)在工業(yè)互聯(lián)網(wǎng)領(lǐng)域的應用提出一些通用的要求,為后續工業(yè)互聯(lián)網(wǎng)基礎技術(shù)的應用和發(fā)展打下理論基礎。

      一、引言

      互聯(lián)網(wǎng)的迅速發(fā)展帶動(dòng)了一波技術(shù)革新,越來(lái)越多新的技術(shù)被運用到了行業(yè)中,以解決實(shí)際問(wèn)題和需求。在工業(yè)界,工業(yè)互聯(lián)網(wǎng)、智能制造這些詞也隨之涌現,人們正在積極探索新技術(shù)在工業(yè)界的應用。但是否所有的新技術(shù)都適合在行業(yè)推廣應用?例如工業(yè)行業(yè),有著(zhù)更為復雜的環(huán)境,對于軟件系統有著(zhù)額外的高要求,特別是系統的實(shí)時(shí)性、穩定性和安全性。多年來(lái),工業(yè)系統一直都較為封閉,使得工業(yè)界的軟件形成了一套較為獨立且成熟的體系。

      在工業(yè)場(chǎng)景中,80%以上的監測數據都是實(shí)時(shí)數據,且都是帶有時(shí)間戳并按順序產(chǎn)生的數據,這些來(lái)源于傳感器或監控系統的數據被實(shí)時(shí)地采集并反饋出系統或作業(yè)的狀態(tài)。在工業(yè)上,通常會(huì )使用實(shí)時(shí)/歷史數據庫作為核心樞紐,對這些數據進(jìn)行采集、存儲以及查詢(xún)分析。

      在工業(yè)領(lǐng)域之外,隨著(zhù)移動(dòng)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、車(chē)聯(lián)網(wǎng)、智能電網(wǎng)等新概念的迅速發(fā)展,也形成了對實(shí)時(shí)數據的分析處理需求,另一種全新架構的解決方案也悄然形成,被稱(chēng)作時(shí)序數據庫,主要面向互聯(lián)網(wǎng)場(chǎng)景下海量數據的實(shí)時(shí)監控和分析需求,它和實(shí)時(shí)/歷史數據庫的功能如此相似,就好比是一對雙胞胎,被不同的家庭撫養長(cháng)大卻還保持著(zhù)相同的容貌。相比于傳統的工業(yè)方案,互聯(lián)網(wǎng)方案的擴展性更好,又天然能和大數據生態(tài)融合,無(wú)疑會(huì )對原有的技術(shù)架構形成挑戰。

      二、傳統工業(yè)場(chǎng)景中對實(shí)時(shí)數據的處理

      傳統工業(yè)控制領(lǐng)域,由于其自身的特殊性,有很多對實(shí)時(shí)數據處理的要求,特別是流程工業(yè)中,對各生產(chǎn)環(huán)節的監控要求十分嚴苛,需要通過(guò)監測數據實(shí)時(shí)反應出系統的狀態(tài),所以對于實(shí)時(shí)數據的處理十分看重,并且經(jīng)過(guò)長(cháng)時(shí)間的積累已經(jīng)形成了一套獨有的成熟的體系。對實(shí)時(shí)/歷史數據庫的應用是其中重要的一環(huán),在工控領(lǐng)域已經(jīng)有很多年的歷史,實(shí)時(shí)數據庫主要用于工業(yè)過(guò)程數據的采集、存儲以及查詢(xún)分析,以實(shí)現過(guò)程狀態(tài)的實(shí)時(shí)監控。工業(yè)上的實(shí)時(shí)數據有這些特征:都帶有時(shí)間戳,并且是按時(shí)間順序生成的;大多為結構化數據;采集頻率高、數據量大等。

      工業(yè)上對軟件的要求從來(lái)都是非常嚴苛的,所以實(shí)時(shí)數據庫在被打磨后,形成了比較明顯的特征,如實(shí)用、嚴謹、穩定、高性能、封閉等。

      以一個(gè)中等規模的工業(yè)企業(yè)為例,在流程監控的環(huán)節中,可能會(huì )涉及到5~10萬(wàn)個(gè)傳感器測點(diǎn),每天產(chǎn)出的數據量能達到上百GB。在通常情況下,工業(yè)企業(yè)都會(huì )要求數據能夠被長(cháng)時(shí)間存儲,這樣可以隨時(shí)查詢(xún)到歷史趨勢。上述的需求顯示出了傳統實(shí)時(shí)數據庫需要具備的一些能力,如因為測點(diǎn)多、采集頻率高,所以要求非常高的寫(xiě)入能力;因為要求長(cháng)期存儲,所以需要強大的數據壓縮能力;因為數據量龐大,所以要求快速的查詢(xún)響應;同時(shí)最重要的是實(shí)時(shí)分析能力,能快速反映出系統的狀態(tài)。

      表1是傳統工業(yè)項目中對實(shí)時(shí)數據庫的考核要求。

      表1  工業(yè)項目中對實(shí)時(shí)數據庫的考核項

      對于工業(yè)傳統的實(shí)時(shí)/歷史數據庫,總結特征如下:

      (1)高速寫(xiě)入性能:工業(yè)實(shí)時(shí)數據庫通常會(huì )對數據寫(xiě)入的速度有很高的要求。以流程工業(yè)的場(chǎng)景為例,會(huì )在每個(gè)環(huán)節都設置傳感器,傳感器的數量眾多且采集頻率都很高,所以數據寫(xiě)入的并發(fā)量會(huì )特別高,有時(shí)甚至會(huì )達到每秒上百萬(wàn)的測點(diǎn)。除了對軟件的要求之外,也會(huì )選擇使用一些高性能的服務(wù)器來(lái)保證數據的寫(xiě)入。

      (2)快速的查詢(xún)響應:查詢(xún)的需求分為兩部分,一是要響應實(shí)時(shí)的查詢(xún)請求,用于及時(shí)反映系統的狀態(tài);二是歷史數據要能快速被查詢(xún),由于歷史數據量非常大,在查詢(xún)時(shí)需要對特定時(shí)間段的數據做聚合,需要做到即使是查一整年的數據情況,也能很快地反映出來(lái)。

      (3)超強的數據壓縮能力:之前提到因為數據會(huì )被存儲很長(cháng)時(shí)間,5年甚至10年都是常有的事,在存儲容量有限的情況下,就需要對數據做一定的壓縮。通常壓縮方式會(huì )分成無(wú)損壓縮和有損壓縮,相比而言,有損壓縮的壓縮比會(huì )更大一些,有時(shí)會(huì )達到1:30~1:40,這就需要設計合理的算法來(lái)保留數據中的細節,使數據在還原后仍能保留重要的特征。

      (4)積累豐富的工具:傳統的實(shí)時(shí)數據庫的解決方案一般是從采集開(kāi)始到可視化的一整套系統,有多年積累形成的豐富的工具包,比如會(huì )積攢上百種的協(xié)議,或者各種場(chǎng)景的數據模型,這些都是工業(yè)軟件的重要競爭力。

      (5)追求極致穩定:工業(yè)上對軟件的穩定性要求特別高,除了使用主備機制來(lái)保證高可用外,一般完全由軟件的編寫(xiě)質(zhì)量來(lái)保證程序的持續運行。

      三、工業(yè)互聯(lián)網(wǎng)時(shí)期的變化和問(wèn)題

      隨著(zhù)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、云計算、大數據、人工智能為代表的新一代技術(shù)的逐步成熟,一輪新的科技革命和產(chǎn)業(yè)變革正在興起,一系列新的生產(chǎn)方式、組織方式和商業(yè)模式開(kāi)始涌現,工業(yè)互聯(lián)網(wǎng)技術(shù)也在日趨成熟。工業(yè)互聯(lián)網(wǎng)是互聯(lián)網(wǎng)和新一代信息技術(shù)與工業(yè)系統全方位深度融合所形成的產(chǎn)業(yè)和應用生態(tài),是工業(yè)智能化發(fā)展的關(guān)鍵綜合信息基礎設施。人們開(kāi)始嘗試使用互聯(lián)網(wǎng)技術(shù)融入設計、生產(chǎn)、管理、服務(wù)等工業(yè)生產(chǎn)的各個(gè)環(huán)節,不論是自主探索或者是學(xué)習其他行業(yè)的成熟經(jīng)驗,不可避免的就是新老技術(shù)的對接。

      隨著(zhù)物聯(lián)網(wǎng)技術(shù)逐步滲透工業(yè),不斷增長(cháng)的傳感器、飆升的數據量以及更高的大數據分析需求對原有的技術(shù)架構提出了挑戰。幾個(gè)問(wèn)題必須直面:

      (1)擴展性遇到瓶頸。傳統的技術(shù)架構雖然能保證單機具備極高的性能,也可以通過(guò)增加機器使性能線(xiàn)性擴展,但是不能像分布式系統那樣實(shí)現動(dòng)態(tài)靈活的擴容和縮容,需要提前進(jìn)行規劃。當業(yè)務(wù)升級需要系統擴容時(shí),老架構的擴展性就很難滿(mǎn)足需求了。

      (2)無(wú)法和大數據生態(tài)對接。數據采集的最終目的是被理解和使用,大數據產(chǎn)業(yè)中對于海量數據的存儲分析已經(jīng)有很成熟的方案,不論是Hadoop還是Spark的生態(tài)圈,都面臨著(zhù)新老技術(shù)的對接。很多工業(yè)企業(yè)因為想使用新的大數據分析技術(shù),不得不對現有的系統進(jìn)行升級或是替換。

      (3)價(jià)格高昂。傳統的工業(yè)實(shí)時(shí)數據庫解決方案價(jià)格都十分昂貴,一般只有大型企業(yè)能接受。但是隨著(zhù)新技術(shù)、新理念的普及,更多的中小企業(yè)也意識到數據的重要性,但考慮到資金投入,會(huì )傾向于尋找價(jià)格更低廉的方案。

      四、從互聯(lián)網(wǎng)發(fā)展而來(lái)的時(shí)序數據庫

      4.1  發(fā)展歷史

      在進(jìn)入互聯(lián)網(wǎng)飛速發(fā)展的時(shí)期之后,隨著(zhù)通信技術(shù)的革新,數據通信成本的下降,掀起了一波又一波萬(wàn)物互聯(lián)的熱潮。不僅是互聯(lián)網(wǎng)監控需要采集數據,人們每天接觸的手機、智能手環(huán)、共享自行車(chē)、汽車(chē)等,都在源源不斷地產(chǎn)生數據。人們實(shí)時(shí)地收集這些數據并發(fā)送到云端,用大數據技術(shù)進(jìn)行分析,對業(yè)務(wù)進(jìn)行監控和預測,以數據驅動(dòng)企業(yè)降本增效,提高服務(wù)質(zhì)量。

      這些數據其實(shí)和工業(yè)領(lǐng)域大部分的實(shí)時(shí)數據有著(zhù)一些相同的特征:?jiǎn)螚l數據不會(huì )很長(cháng),但是數據量很大;都帶有時(shí)間戳,且按順序生成;數據大部分都是結構化的,用于描述某個(gè)參數在某個(gè)時(shí)間點(diǎn)的特征;寫(xiě)入的頻率會(huì )比查詢(xún)的頻率高很多;已存儲的數據很少有更新的需求;用戶(hù)會(huì )更關(guān)心一段時(shí)間的數據特征,而不是某一個(gè)時(shí)間點(diǎn);數據的查詢(xún)分析大多基于某一個(gè)時(shí)間段或者某個(gè)數值范圍;需要進(jìn)行統計和可視化的展示。

      這些特征同樣可以對應到智能電表、環(huán)境監測設備、工業(yè)生產(chǎn)線(xiàn)產(chǎn)生的數據。但由于產(chǎn)生的時(shí)期和場(chǎng)景不同,工業(yè)上的解決方案會(huì )和互聯(lián)網(wǎng)的解決方案存在一定的差異(見(jiàn)表2)。

      表2  兩種數據庫方案的差異

      新架構下的時(shí)序數據庫在處理這些互聯(lián)網(wǎng)數據時(shí)的需求和傳統的實(shí)時(shí)數據庫有異曲同工之妙,可以說(shuō)是同一種功能需求在不同領(lǐng)域的實(shí)現形式?;ヂ?lián)網(wǎng)新技術(shù)在向工業(yè)滲透的時(shí)候,會(huì )反映出一定的優(yōu)勢和劣勢,而工業(yè)互聯(lián)網(wǎng)技術(shù)的發(fā)展也應順應雙方技術(shù)的互相滲透融合,互相吸收優(yōu)點(diǎn)、彌補缺點(diǎn),共同往更好的方向發(fā)展。

      4.2 技術(shù)趨勢

      隨著(zhù)工業(yè)互聯(lián)網(wǎng)發(fā)展的需求日益清晰,在這兩種數據庫技術(shù)互相滲透的過(guò)程中,可以觀(guān)察到一些技術(shù)的發(fā)展趨勢。

      (1)逐步向分布式架構轉變:傳統的實(shí)時(shí)數據庫多是主備的部署架構,通常要求有較高配置的機器,來(lái)追求單機極致的性能;同時(shí),在穩定性方面,會(huì )對運行軟件的穩定性做極高的要求,完全由高質(zhì)量的代碼來(lái)保證運行的穩定;由于存儲容量有限,也會(huì )要求超高的數據壓縮比。但時(shí)序數據庫的分布式架構,使得系統能夠輕松地進(jìn)行水平擴展,讓數據庫不再依賴(lài)昂貴的硬件和存儲設備,以集群天然的優(yōu)勢來(lái)實(shí)現高可用,不會(huì )出現單點(diǎn)的瓶頸或故障,在普通的x86服務(wù)器甚至是虛擬機上都可以運行,大大降低了使用成本。

      (2)更靈活的數據模型:傳統的實(shí)時(shí)數據庫由于工業(yè)場(chǎng)景的特殊性,常使用的是單值模型,一個(gè)被監控的參數稱(chēng)為一個(gè)測點(diǎn),在寫(xiě)入時(shí)會(huì )對每一個(gè)測點(diǎn)建一個(gè)模型,比如一個(gè)風(fēng)機的溫度指標算一個(gè)測點(diǎn),10個(gè)風(fēng)機的10個(gè)指標就是100個(gè)測點(diǎn),每個(gè)測點(diǎn)會(huì )附帶描述信息(名稱(chēng)、精度、數據類(lèi)型、開(kāi)關(guān)量/模擬量等),查詢(xún)的時(shí)候就會(huì )針對每個(gè)測點(diǎn)去查詢(xún)數值。單值模型的寫(xiě)入效率會(huì )很高。

      而時(shí)序數據庫,開(kāi)始采用多值模型,類(lèi)似面向對象的處理方式,例如風(fēng)機是一種數據模型,可以包括溫度、壓力等多個(gè)測量維度,還包括經(jīng)緯度、編號等標簽信息,這樣對外提供服務(wù)時(shí)會(huì )更適合分析的場(chǎng)景。當然,單值模型和多值模型是可以互相轉換的,很多數據庫對外提供的服務(wù)為多值模型,但是底層存儲還是單值模型。

      (3)SQL需求依然存在:目前大部分的時(shí)序數據庫都選擇了擴展性較好的NoSQL數據庫作為底層存儲,相比于關(guān)系型數據庫,NoSQL的數據模型更靈活,非常適合時(shí)序數據的多值模型;更易擴展,在資源受限或者需要提升性能的時(shí)候,可以輕易地增加機器;查詢(xún)效率高;開(kāi)源軟件成本低。表3為開(kāi)源時(shí)序數據庫使用的底層存儲模型。

      表3  開(kāi)源時(shí)序數據庫使用的底層存儲模型

      使用NoSQL數據庫也會(huì )丟失一些特性,比如不支持事務(wù),需要通過(guò)其他手段來(lái)保證數據一致性;比如不支持SQL,SQL作為一種標準查詢(xún)語(yǔ)句,已經(jīng)被人們所習慣,是一種學(xué)習成本極低的操作,所以現在許多時(shí)序數據庫的廠(chǎng)家也在嘗試集成SQL引擎,降低產(chǎn)品使用的門(mén)檻。

      (4)查詢(xún)要求以及表現形式更多樣化:在互聯(lián)網(wǎng)時(shí)代,查詢(xún)的要求已經(jīng)不僅僅是滿(mǎn)足于一些基礎的條件查詢(xún)或是插值查詢(xún),隨著(zhù)物聯(lián)網(wǎng)場(chǎng)景的豐富以及人們對信息全面掌控的需求,基于地圖的應用越來(lái)越多,查詢(xún)會(huì )由時(shí)間的維度逐步擴展到空間的維度,除了保證實(shí)時(shí)性之外,更豐富的可視化的展現也是一大趨勢。

      (5)逐步轉向云服務(wù):傳統的工業(yè)場(chǎng)景處理實(shí)時(shí)數據出于安全和性能等原因都會(huì )使用私有化部署。機器、軟件以及后續的服務(wù)是一筆十分高昂的開(kāi)銷(xiāo),還需要配備專(zhuān)業(yè)的技術(shù)人員進(jìn)行系統的維護。當服務(wù)逐步上云后,一方面省去了購置機器的成本,不需要特別安排維護機器和軟件系統的工程師,只需要懂得如何開(kāi)發(fā)和維護業(yè)務(wù)就可以。另外,服務(wù)使用多少就購買(mǎi)多少,避免一次性購買(mǎi)服務(wù)造成的資源浪費或者資源不足再進(jìn)行二次建設,可以為企業(yè)減少很大一筆開(kāi)銷(xiāo)。隨著(zhù)網(wǎng)絡(luò )和云計算技術(shù)的成熟,相關(guān)的性能和安全性也會(huì )不斷的升級,最終趨近于私有化部署的效果,服務(wù)上云已經(jīng)成為了一個(gè)不可阻擋的趨勢。

      (6)逐步向邊緣計算發(fā)展:工業(yè)領(lǐng)域是IoT的重要試驗田,工業(yè)互聯(lián)網(wǎng)的發(fā)展勢必會(huì )帶來(lái)更多傳感器的使用以及更多數據的采集。當數據過(guò)于龐大,集中化的處理方式就很難響應實(shí)時(shí)的數據分析需求,這就帶來(lái)了數據計算向邊緣的發(fā)展,需要實(shí)時(shí)響應的監控就通過(guò)邊緣設備及時(shí)的處理并反饋,需要用于大規模分析的數據再進(jìn)行集中存儲,這種分級的處理方式能夠有效地提升時(shí)效性數據的價(jià)值,同時(shí)減輕存儲系統的負擔,所以許多時(shí)序數據庫正在研發(fā)邊緣計算版本,并配合流計算的能力使功能更加豐富。融合了邊緣計算的時(shí)序數據解決方案會(huì )更適合工業(yè)互聯(lián)網(wǎng)的處理場(chǎng)景(見(jiàn)圖1)。

      圖1  使用邊緣計算技術(shù)實(shí)時(shí)處理數據的一種方案

      五、產(chǎn)品調研

      結合調研,總結了互聯(lián)網(wǎng)行業(yè)和工業(yè)企業(yè)中對實(shí)時(shí)/時(shí)序數據庫使用的一些共性要求,列出了33條細則,其中有7項設置為了可選項,不滿(mǎn)足不會(huì )影響正常的業(yè)務(wù)要求,滿(mǎn)足能為產(chǎn)品加分。

      此次測試的目的是為了檢驗這些軟件架構上的不同是否會(huì )影響到基礎功能服務(wù)的提供,并進(jìn)一步驗證數據庫應具備的技術(shù)要求。對國內7家提供實(shí)時(shí)/時(shí)序數據庫服務(wù)的廠(chǎng)家進(jìn)行了一輪測試,參與者包括大型云服務(wù)提供商、傳統工業(yè)信息化解決方案提供商以及一些創(chuàng )業(yè)公司;產(chǎn)品覆蓋了NoSQL模型和關(guān)系模型、B/S架構和C/S架構、開(kāi)源軟件和自主研發(fā)的軟件;部署模式涵蓋了本地化部署和云服務(wù)。

      測試結果顯示,在25項必須具備的能力中,這些不同廠(chǎng)家的產(chǎn)品基本都能滿(mǎn)足,僅有一家產(chǎn)品不具備加密通信能力。由于服務(wù)的領(lǐng)域和場(chǎng)景不同,對于7個(gè)可選項,各家的產(chǎn)品展現出了一定的差異,以滿(mǎn)足不同的業(yè)務(wù)需求(見(jiàn)表4)。

      表4  7家企業(yè)的測評情況

      六、技術(shù)要求

      在總結了業(yè)界的多款產(chǎn)品以及現階段的一些業(yè)務(wù)需求之后,總結了時(shí)序數據庫需要具備的一些技術(shù)要求,分為幾個(gè)層面:一是基礎功能,能保證數據庫具備可用性的一些最基礎的操作;其次是管理能力,決定產(chǎn)品的可管理性和易用性;再就是維護產(chǎn)品穩定運行和持續優(yōu)化的一些特性,比如兼容能力、容錯能力、擴展性、安全性;最后是性能方面的一些考察項。

      6.1  基礎功能

      功能層面的要求決定了時(shí)序數據庫產(chǎn)品是否滿(mǎn)足最基礎的一些使用條件:涵蓋常用的額數據類(lèi)型,如int、long、float、string、bool、bytearray等;數據的操作不丟失精度,支持毫秒精度數據讀寫(xiě);支持單域或多域寫(xiě)入,提供單次和批量寫(xiě)入接口;可以增加時(shí)間序列;支持單個(gè)時(shí)間序列和多個(gè)時(shí)間序列的查詢(xún);支持按標簽進(jìn)行過(guò)濾,包括精確匹配和模糊匹配;提供插值查詢(xún)能力,將數據補齊,并支持多種插值算法;支持按數值進(jìn)行時(shí)間序列和數據點(diǎn)過(guò)濾;支持獲取最新數據點(diǎn);提供多種維度的聚合查詢(xún)接口,包括時(shí)間窗口聚合、標簽分組,以及min、max、avg、count、sum等基本聚合函數;能夠實(shí)現可編程函數以滿(mǎn)足一些定制化的查詢(xún)要求;在物聯(lián)網(wǎng)的使用場(chǎng)景下,能進(jìn)行基于地理位置的聚合查詢(xún);支持按時(shí)間管理歷史數據,提供過(guò)期時(shí)間設置接口,可以高效清理歷史數據。

      6.2  管理能力

      完整和友好的管理能力可以有效地支撐時(shí)序數據庫的使用和維護,有助于數據庫的使用者和維護團隊有更好的使用體驗。具體指標包括:具備友好的部署能力或服務(wù)開(kāi)通能力;全局范圍內的數據庫配置在線(xiàn)管理能力;能夠對數據庫狀態(tài)進(jìn)行實(shí)時(shí)監控,并具備告警能力;支持用戶(hù)的新增、刪除等管理能力,支持為用戶(hù)分配不同的權限;數據庫具備在線(xiàn)組件升級功能;能夠查看時(shí)間序列的定義、標簽的定義、指標的定義;支持與其他類(lèi)型數據庫間的數據導入和導出。

      6.3  兼容能力

      指數據庫產(chǎn)品能否與主流硬件、軟件及大數據生態(tài)對接的能力,具體包括:數據庫能夠在x86/x86-64等主流硬件上正常運行,異構硬件特別是不同CPU型號和主流操作系統能夠兼容;建議支持容器部署;能夠與Hadoop/Spark等大數據分析平臺對接。

      6.4  容錯能力

      時(shí)序數據庫應該具備一定的容錯能力,確保集群在硬件或軟件異常的情況下仍能保證數據與服務(wù)的完整性,內容包括:在發(fā)生硬件故障、操作系統故障或軟件服務(wù)故障時(shí),運行中的服務(wù)不會(huì )受到影響;當請求超過(guò)集群能承載的壓力時(shí),能夠通過(guò)一定的機制保證系統的可用性;能夠支持數據多副本存儲,在副本丟失時(shí)不影響查詢(xún)業(yè)務(wù)。

      6.5  擴展性

      時(shí)序數據庫應該具備良好的擴展性,能夠根據業(yè)務(wù)需求隨時(shí)進(jìn)行集群的擴展和收縮,并保持數據的均衡:數據庫集群具備集群擴展能力,擴展前后保持數據均衡,且性能能夠隨之提升;數據庫集群具備集群縮減能力,縮減前后保持數據均衡。

      6.6  安全性

      時(shí)序數據庫應具備安全保障能力,主要包含:能夠對接入數據庫用戶(hù)進(jìn)行身份認證工作;能夠對數據庫內操作進(jìn)行審計工作;能夠支持客戶(hù)端與服務(wù)器端的加密通信,如HTTPS。

      6.7  性能

      時(shí)序數據庫應具備較高的處理性能,需要考察的內容包括:寫(xiě)入吞吐量、寫(xiě)入時(shí)延;查詢(xún)并發(fā)度、查詢(xún)時(shí)延;聚合操作時(shí)延;數據導入并發(fā)度、時(shí)延;數據壓縮的效率。

      七、結束語(yǔ)

      本文從幾個(gè)層面分析了工業(yè)中時(shí)序數據處理的挑戰,描述了工業(yè)領(lǐng)域傳統的處理方案,以及在互聯(lián)網(wǎng)領(lǐng)域發(fā)展出的新技術(shù)架構,并進(jìn)行了對比。為了解決工業(yè)中新涌現的問(wèn)題,兩種實(shí)現方案需要各取所長(cháng),互為補充,以使互聯(lián)網(wǎng)技術(shù)更好地在工業(yè)領(lǐng)域應用。并對產(chǎn)業(yè)界時(shí)序數據庫技術(shù)的發(fā)展方向進(jìn)行了分析,通過(guò)對需求方和供給側的研究,總結出了一些在新時(shí)期對于時(shí)序數據庫的技術(shù)要求。這項工作對于工業(yè)數據應用的后續發(fā)展具有很重要的意義,還將繼續研究時(shí)序數據處理的性能要求,并研發(fā)適合工業(yè)場(chǎng)景數據特征的測試基準和工具。

      作者簡(jiǎn)介

      王妙瓊:中國信息通信研究院云計算與大數據研究所大數據與區塊鏈部工程師。

      聯(lián)系方式:wangmiaoqiong@caict.ac.cn

      魏凱:中國信息通信研究院云計算與大數據研究所副所長(cháng),工業(yè)互聯(lián)網(wǎng)產(chǎn)業(yè)聯(lián)盟工業(yè)大數據特設組副主席,國際電信聯(lián)盟第十六研究國內對口組組長(cháng),國際電信聯(lián)盟分布式賬本標準組副主席,TC601大數據技術(shù)標準推進(jìn)委員會(huì )常務(wù)副主席。

      聯(lián)系方式:weikai@caict.ac.cn

      姜春宇:中國信息通信研究院云計算與大數據研究所大數據與區塊鏈部副主任,工程師。

      聯(lián)系方式:jiangchunyu@caict.ac.cn

      來(lái)源:中國信通院

      熱點(diǎn)新聞

      推薦產(chǎn)品

      x
      • 在線(xiàn)反饋
      1.我有以下需求:



      2.詳細的需求:
      姓名:
      單位:
      電話(huà):
      郵件:
      欧美精品欧美人与动人物牲交_日韩乱码人妻无码中文_国产私拍大尺度在线视频_亚洲男人综合久久综合天

    2. <blockquote id="fficu"><optgroup id="fficu"></optgroup></blockquote>

      <table id="fficu"></table>

      <sup id="fficu"></sup>
      <output id="fficu"></output>