• <blockquote id="fficu"><optgroup id="fficu"></optgroup></blockquote>

    <table id="fficu"></table>

    <sup id="fficu"></sup>
    <output id="fficu"></output>
    1. 20240703
      關(guān)注中國自動(dòng)化產(chǎn)業(yè)發(fā)展的先行者!
      工業(yè)智能邊緣計算2024年會(huì )
      2024
      2024中國自動(dòng)化產(chǎn)業(yè)年會(huì )
      2023年工業(yè)安全大會(huì )
      OICT公益講堂
      當前位置:首頁(yè) >> 資訊 >> 行業(yè)資訊

      資訊頻道

      你的隱私,大數據怎知道
      • 點(diǎn)擊數:648     發(fā)布時(shí)間:2023-01-27 14:14:29
      • 分享到:
      大數據利用了一種名叫“大數據挖掘”的技術(shù),采用諸如神經(jīng)網(wǎng)絡(luò )、遺傳算法、決策樹(shù)、粗糙集、覆蓋正例排斥反例、統計分析、模糊集等方法挖掘信息。大數據挖掘的過(guò)程,可以分為數據收集、數據集成、數據規約、數據清理、數據變換、挖掘分析、模式評估、知識表示等八大步驟。
      關(guān)鍵詞: 大數據 , 垃圾處理 , 隱私保護

      在網(wǎng)絡(luò )上,每個(gè)人都會(huì )或多或少,或主動(dòng)或被動(dòng)地泄露某些碎片信息。這些信息被大數據挖掘,就存在隱私泄露的風(fēng)險,引發(fā)信息安全問(wèn)題。面對洶涌而來(lái)的5G時(shí)代,大眾對自己的隱私保護感到越來(lái)越迷茫,甚至有點(diǎn)不知所措。那么,你的隱私,大數據是怎么知道的呢?大家又該如何自我保護呢?

      1.“已知、未知”大數據都知道

      大數據時(shí)代,每個(gè)人都有可能成為安徒生童話(huà)中那個(gè)“穿新衣”的皇帝。在大數據面前,你說(shuō)過(guò)什么話(huà),它知道;你做過(guò)什么事,它知道;你有什么愛(ài)好,它知道;你生過(guò)什么病,它知道;你家住哪里,它知道;你的親朋好友都有誰(shuí),它也知道……總之,你自己知道的,它幾乎都知道,或者說(shuō)它都能夠知道,至少可以說(shuō),它遲早會(huì )知道!

      甚至,連你自己都不知道的事情,大數據也可能知道。例如,它能夠發(fā)現你的許多潛意識習慣:集體照相時(shí)你喜歡站哪里呀,跨門(mén)檻時(shí)喜歡先邁左腳還是右腳呀,你喜歡與什么樣的人打交道呀,你的性格特點(diǎn)都有什么呀,哪位朋友與你的觀(guān)點(diǎn)不相同呀……

      再進(jìn)一步說(shuō),今后將要發(fā)生的事情,大數據還是有可能知道。例如,根據你“飲食多、運動(dòng)少”等信息,它就能夠推測出,你可能會(huì )“三高”。當你與許多人都在獨立地購買(mǎi)感冒藥時(shí),大數據就知道:流感即將暴發(fā)了!其實(shí),大數據已經(jīng)成功地預測了包括世界杯比賽結果、股票的波動(dòng)、物價(jià)趨勢、用戶(hù)行為、交通情況等。

      當然,這里的“你”并非僅僅指“你個(gè)人”,包括但不限于,你的家庭,你的單位,你的民族,甚至你的國家等。至于這些你知道的、不知道的或今后才知道的隱私信息,將會(huì )把你塑造成什么,是英雄還是狗熊?這卻難以預知。

      2.數據挖掘就像“垃圾處理”

      什么是大數據?形象地說(shuō),所謂大數據,就是由許多千奇百怪的數據,雜亂無(wú)章地堆積在一起。例如,你在網(wǎng)上說(shuō)的話(huà)、發(fā)的微信、收發(fā)的電子郵件等,都是大數據的組成部分。在不知道的情況下被采集的眾多信息,例如被馬路攝像頭獲取的視頻、手機定位系統留下的路線(xiàn)圖、駕車(chē)的導航信號等被動(dòng)信息,也都是大數據的組成部分。還有,各種傳感器設備自動(dòng)采集的有關(guān)溫度、濕度、速度等萬(wàn)物信息,仍然是大數據的組成部分??傊?,每個(gè)人、每種通信和控制類(lèi)設備,無(wú)論它是軟件還是硬件,其實(shí)都是大數據之源。

      大數據利用了一種名叫“大數據挖掘”的技術(shù),采用諸如神經(jīng)網(wǎng)絡(luò )、遺傳算法、決策樹(shù)、粗糙集、覆蓋正例排斥反例、統計分析、模糊集等方法挖掘信息。大數據挖掘的過(guò)程,可以分為數據收集、數據集成、數據規約、數據清理、數據變換、挖掘分析、模式評估、知識表示等八大步驟。

      不過(guò),這些聽(tīng)起來(lái)高大上的大數據產(chǎn)業(yè),幾乎等同于垃圾處理和廢品回收。

      這并不是在開(kāi)玩笑。廢品收購和垃圾收集,可算作“數據收集”;將廢品和垃圾送往集中處理場(chǎng)所,可算作“數據集成”;將廢品和垃圾初步分類(lèi),可算作“數據規約”;將廢品和垃圾適當清潔和整理,可算作“數據清理”;將破沙發(fā)拆成木、鐵、布等原料,可算作“數據變換”;認真分析如何將這些原料賣(mài)個(gè)好價(jià)錢(qián),可算作“數據分析”;不斷總結經(jīng)驗,選擇并固定上下游賣(mài)家和買(mǎi)家,可算作“模式評估”;最后,把這些技巧整理成口訣,可算作“知識表示”。

      再看原料結構。大數據具有異構特性,就像垃圾一樣千奇百怪。如果非要在垃圾和大數據之間找出本質(zhì)差別的話(huà),那就在于垃圾是有實(shí)體的,再利用的次數有限;而大數據是虛擬的,可以反復處理,反復利用。例如,大數據專(zhuān)家能將數據(廢品)中挖掘出的旅客出行規律交給航空公司,將某群體的消費習慣賣(mài)給百貨商店等??傊?,大數據專(zhuān)家完全可以“一菜多吃”,反復利用,而且時(shí)間越久,價(jià)值越大。換句話(huà)說(shuō),大數據是很值錢(qián)的“垃圾”。

      3.大數據挖掘永遠沒(méi)有盡頭

      大數據挖掘,雖然能從正面創(chuàng )造價(jià)值,但是也有其負面影響,即存在泄露隱私的風(fēng)險。隱私是如何被泄露的呢?這其實(shí)很簡(jiǎn)單,我們先來(lái)分解一下“人肉搜索”是如何侵犯隱私的吧!

      一大群網(wǎng)友,出于某種目的,利用自己的一切資源渠道,盡可能多地收集當事人或物的所有信息;然后,將這些信息按照自己的目的提煉成新信息,反饋到網(wǎng)上與別人分享。這就完成了第一次“人肉迭代”。

      接著(zhù),大家又在第一次人肉迭代的基礎上,互相取經(jīng),再接再厲,交叉重復進(jìn)行信息的收集、加工、整理等工作,于是,便誕生了第二次“人肉迭代”。如此循環(huán)往復,經(jīng)過(guò)多次不懈迭代后,當事人或物的畫(huà)像就躍然紙上了。如果構成“滿(mǎn)意畫(huà)像”的素材確實(shí)已經(jīng)證實(shí),至少主體是事實(shí),“人肉搜索”就成功了。

      幾乎可以斷定,只要參與“人肉搜索”的網(wǎng)友足夠多,時(shí)間足夠長(cháng),大家的毅力足夠強,那么任何人都可能無(wú)處遁形。

      其實(shí),所謂的大數據挖掘,在某種意義上說(shuō),就是由機器自動(dòng)完成的特殊“人肉搜索”而已。只不過(guò),這種搜索的目的,不再限于抹黑或頌揚某人,而是有更加廣泛的目的,例如,為商品銷(xiāo)售者尋找最佳買(mǎi)家、為某類(lèi)數據尋找規律、為某些事物之間尋找關(guān)聯(lián)等??傊?,只要目的明確,那么,大數據挖掘就會(huì )有用武之地。

      如果將“人肉搜索”與大數據挖掘相比,網(wǎng)友被電腦所替代;網(wǎng)友們收集的信息,被數據庫中的海量異構數據所替代;網(wǎng)友尋找各種人物關(guān)聯(lián)的技巧,被相應的智能算法替代;網(wǎng)友們相互借鑒、彼此啟發(fā)的做法,被各種同步運算所替代。

      各次迭代過(guò)程仍然照例進(jìn)行,只不過(guò)機器的迭代次數更多,速度更快,每次迭代其實(shí)就是機器的一次“學(xué)習”過(guò)程。網(wǎng)友們的最終“滿(mǎn)意畫(huà)像”,被暫時(shí)的挖掘結果所替代。之所以說(shuō)是暫時(shí),那是因為對大數據挖掘來(lái)說(shuō),永遠沒(méi)有盡頭,結果會(huì )越來(lái)越精準,智慧程度會(huì )越來(lái)越高,用戶(hù)只需根據自己的標準,隨時(shí)選擇滿(mǎn)意的結果就行了。

      當然,除了相似性外,“人肉搜索”與“大數據挖掘”肯定也有許多重大的區別。例如,機器不會(huì )累,它們收集的數據會(huì )更多、更快,數據的渠道來(lái)源會(huì )更廣泛??傊?,網(wǎng)友的“人肉搜索”,最終將輸給機器的“大數據挖掘”。

      4.隱私保護與數據挖掘“?!薄皺C”并存

      必須承認,就當前的現實(shí)情況來(lái)說(shuō),大數據隱私挖掘的“殺傷力”,已經(jīng)遠遠超過(guò)了大數據隱私保護的能力;換句話(huà)說(shuō),在大數據挖掘面前,當前人類(lèi)有點(diǎn)不知所措。這確實(shí)是一種意外。自互聯(lián)網(wǎng)誕生以后,在過(guò)去幾十年,人們都不遺余力地將碎片信息永遠留在網(wǎng)上。其中的每個(gè)碎片雖然都完全無(wú)害,可誰(shuí)也不曾意識到,至少沒(méi)有刻意去關(guān)注,當眾多無(wú)害碎片融合起來(lái),竟然后患無(wú)窮!

      不過(guò),大家也沒(méi)必要過(guò)于擔心。在人類(lèi)歷史上,類(lèi)似的被動(dòng)局面已經(jīng)出現過(guò)不止一次了。從以往的經(jīng)驗來(lái)看,隱私保護與數據挖掘之間總是像“走馬燈”一樣輪換的——人類(lèi)通過(guò)對隱私的“挖掘”,獲得空前好處,產(chǎn)生了更多需要保護的“隱私”,于是,不得不再回過(guò)頭來(lái),認真研究如何保護這些隱私。當隱私積累得越來(lái)越多時(shí),“挖掘”它們就會(huì )變得越來(lái)越有利可圖,于是,新一輪的“挖掘”又開(kāi)始了。歷史地來(lái)看,人類(lèi)在自身隱私保護方面,整體處于優(yōu)勢地位,在網(wǎng)絡(luò )大數據挖掘之前,“隱私泄露”并不是一個(gè)突出的問(wèn)題。

      但是,現在人類(lèi)需要面對一個(gè)棘手的問(wèn)題——對過(guò)去遺留在網(wǎng)上的海量碎片信息,如何進(jìn)行隱私保護呢?單靠技術(shù),顯然不行,甚至還會(huì )越“保護”,就越“泄露隱私”。

      因此,必須多管齊下。例如從法律上,禁止以“人肉搜索”為目的的大數據挖掘行為;從管理角度,發(fā)現惡意的大數據搜索行為,對其進(jìn)行必要的監督和管控。另外,在必要的時(shí)候,還需要重塑“隱私”概念,畢竟“隱私”本身就是一個(gè)與時(shí)間、地點(diǎn)、民族、文化等有關(guān)的約定俗成的概念。

      對于個(gè)人的網(wǎng)絡(luò )行為而言,在大數據時(shí)代,應該如何保護隱私呢?或者說(shuō),至少不要把過(guò)多包含個(gè)人隱私的碎片信息遺留在網(wǎng)上呢?答案只有兩個(gè)字:匿名!只要做好匿名工作,就能在一定程度上,保護好隱私了。也就是說(shuō),在大數據技術(shù)出現之前,隱私就是把“私”藏起來(lái),個(gè)人身份可公開(kāi),而大數據時(shí)代,隱私保護則是把“私”公開(kāi)(實(shí)際上是沒(méi)法不公開(kāi)),而把個(gè)人身份隱藏起來(lái),即匿名。

      來(lái)源:《經(jīng)濟日報》

      熱點(diǎn)新聞

      推薦產(chǎn)品

      x
      • 在線(xiàn)反饋
      1.我有以下需求:



      2.詳細的需求:
      姓名:
      單位:
      電話(huà):
      郵件:
      欧美精品欧美人与动人物牲交_日韩乱码人妻无码中文_国产私拍大尺度在线视频_亚洲男人综合久久综合天

    2. <blockquote id="fficu"><optgroup id="fficu"></optgroup></blockquote>

      <table id="fficu"></table>

      <sup id="fficu"></sup>
      <output id="fficu"></output>