大科學(xué)開(kāi)啟大數據、大發(fā)現新時(shí)代
大科學(xué)工程,是以工程方式、計劃手段、匯聚科技資源與力量整體推進(jìn)重大科技計劃的最新范式,是科學(xué)研究由傳統的“手工小作坊”向現代大規模“工場(chǎng)”演進(jìn)的一次革命。大科學(xué)范式的“兵團作戰”,將以空域和領(lǐng)域維度上的大規模,甚至超越時(shí)域維度上的長(cháng)尺度,實(shí)現今朝一日、史上數年的突破。
大科學(xué)是大數據的搖籃,大數據是大科學(xué)的產(chǎn)物
大科學(xué)的王者之道始于大數據的產(chǎn)生。人類(lèi)歷史上的大數據,源于科技領(lǐng)域,確切地說(shuō)源于大科學(xué)研究。曼哈頓計劃打開(kāi)了微觀(guān)世界,并開(kāi)創(chuàng )了借用人造的大科學(xué)設施洞開(kāi)微觀(guān)世界的嶄新科學(xué)方法論,以此為依托啟動(dòng)了一系列大科學(xué)計劃,它們產(chǎn)生了史無(wú)前例的超大規模數據。如位于瑞士的歐洲核子研究中心、由全球逾8000位物理學(xué)家合作興建的大型強子對撞機,2008年試運行后,數據量即達25PB/年,2020年建成后將達200PB/年,因此他們率先創(chuàng )建了“大數據”的概念。無(wú)獨有偶,旨在測定人類(lèi)基因組30億堿基遺傳密碼的基因組計劃,進(jìn)行個(gè)體基因組測定時(shí)數據量即已高達13PB/年。而此計劃后,學(xué)界受其鼓舞開(kāi)展了一系列遺傳背景迥異、不同疾病群體以及大量其他物種的基因組測序,數據量迅速逼近ZB級(是PB的百萬(wàn)倍),不約而同地創(chuàng )造了“大數據”概念。今天人們常用的互聯(lián)網(wǎng)最初就是這些領(lǐng)域的科學(xué)家為解決海量數據傳輸而發(fā)明的。
人類(lèi)理性對物質(zhì)世界、人類(lèi)社會(huì )和精神世界的認識,其最高境界是智慧。而要達此境界必然經(jīng)過(guò)數據、信息、知識三個(gè)層階,其中,數據是信息之母、知識之初、智慧之源。隨著(zhù)信息技術(shù)持續數十年的迅猛發(fā)展以及人類(lèi)社會(huì )各行各業(yè)信息化的強力輻射,在人類(lèi)紀元新千年的鐘聲敲響不久,文明世界就掀起了史無(wú)前例的大數據狂潮,其奔涌之疾,升騰之烈,不似海嘯,勝似海嘯。人們歡呼,因為它是摧枯拉朽、一往無(wú)前的狂飆,將以勢不可擋的革命性力量,開(kāi)辟新的天地;人們恐懼,因為它是行不由韁、漫無(wú)方向的野馬,有著(zhù)難以預想的破壞性力量。此時(shí)此刻,人類(lèi)需要冷靜,人類(lèi)必須理性。
人類(lèi)文明迄今經(jīng)歷了三次浪潮:第一次是農業(yè)革命,數千年前出現并持續數千年,釋放出“物之力”;第二次是工業(yè)革命,數百年前出現并已持續數百年,釋放出“能之力”;第三次是智業(yè)革命,數十年前開(kāi)始孕育,目前正處初級階段,將不斷釋放“智之力”。1980年,托夫勒預言了這次新起的文明,并明確指出這次文明將以信息化為標志。其后,恰如其料,技術(shù)與文明的信息化有如神助,在人類(lèi)社會(huì )各領(lǐng)域、全球各地域甚至更廣闊的空域天域似地火一般的點(diǎn)燃、普及。信息社會(huì )、信息文明似乎轉眼間唾手即得,更有大數據時(shí)代的“即時(shí)”到來(lái)好像為此作了一目了然的注解。冷靜分析,實(shí)則不然。數據是信息之母,沒(méi)有數據,何來(lái)信息?缺乏數據的時(shí)代,怎能是名副其實(shí)的信息時(shí)代?而剛剛才來(lái)的大數據時(shí)代,恰恰表明此前是數據欠缺的“時(shí)代”。此前,人類(lèi)發(fā)現、開(kāi)辟的大量全新的數據空間,構建的超大型數據生產(chǎn)“工廠(chǎng)”、超大型數據倉庫,建設的“信息高速公路”及其四通八達的網(wǎng)絡(luò ),為大數據的涌現及其廣泛輻射確實(shí)提供了充分的先決條件,但它們僅是大數據的搖籃,而不是搖籃里的嬰兒。
從大數據向大信息升華,亟待統計科學(xué)與數據科學(xué)的革新
數據是信息之母,但再好的數據也不會(huì )自動(dòng)生成信息。大數據得來(lái)不易,但轉化為大信息更難,而不能轉化為大信息的大數據就是橫亙于人類(lèi)認知之旅的理性黑洞、知性沙漠。實(shí)際上,人類(lèi)理性跨過(guò)蒙昧之初,就擁有了將數據轉換為信息的能力,這也是智人與直立人的分水嶺。
然而,面對時(shí)下大數據時(shí)代奔涌的多元、多源、異構的海量數據,無(wú)論是被美譽(yù)為“孕育了現代科學(xué)”的統計科學(xué),還是應大科學(xué)之運而生、當今正如日中天的數據科學(xué),都還只能是望洋興嘆。今日之大數據,明日之大信息,扭轉乾坤者,還屬革新后的統計科學(xué)與數據科學(xué)。
信息雖然衍進(jìn)自數據、珍貴于數據,但也只是其通向知識的中繼站。知識,是人類(lèi)理性認識世界的結晶,是改造世界的基石。培根在《偉大的復興》中豪邁地預言:知識就是力量。大約400年后,人類(lèi)終于迎來(lái)“知識經(jīng)濟時(shí)代”。知識經(jīng)濟,作為人類(lèi)社會(huì )經(jīng)濟增長(cháng)方式與經(jīng)濟發(fā)展的全新模式,被稱(chēng)為經(jīng)濟領(lǐng)域的哥白尼革命,其基本特征是:知識運營(yíng)為經(jīng)濟增長(cháng)方式、知識產(chǎn)業(yè)成為龍頭產(chǎn)業(yè)、知識經(jīng)濟成為新的最活躍的經(jīng)濟形態(tài)。
由此可見(jiàn),知識不僅是力量,而且是時(shí)代最核心、最強勁的先鋒力量。但我們同時(shí)必須清醒地認識到:大數據與大知識,尚隔兩重天,如將大數據比作洪水、比作奔流,它只有首先蒸發(fā)為大信息的氣流,繼而升騰為大知識的彩虹,才能氣貫長(cháng)虹、一飛沖天而成為引領(lǐng)知識經(jīng)濟時(shí)代的“巨龍”。
2015年大數據發(fā)展十大預測
1.結合智能計算的大數據分析成為熱點(diǎn),包括大數據與神經(jīng)計算、深度學(xué)習、語(yǔ)義計算以及人工智能其他相關(guān)技術(shù)結合,成為大數據分析領(lǐng)域的熱點(diǎn)。
2.數據科學(xué)帶動(dòng)多學(xué)科融合,但是數據科學(xué)作為新興的學(xué)科,其學(xué)科基礎問(wèn)題體系尚不明朗,數據科學(xué)自身的發(fā)展尚未成體系。
3.跨學(xué)科領(lǐng)域交叉的數據融合分析與應用將成為今后大數據分析應用發(fā)展的重大趨勢。
4.大數據將與物聯(lián)網(wǎng)、移動(dòng)互聯(lián)、云計算、社會(huì )計算等熱點(diǎn)技術(shù)領(lǐng)域相互交叉融合,產(chǎn)生很多綜合性應用。
5.大數據多樣化處理模式與軟硬件基礎設施逐步夯實(shí)。
6.大數據安全和隱私。
7.新的計算模式將取得突破。
8.各種可視化技術(shù)和工具提升大數據分析。
9.大數據技術(shù)課程體系建設和人才培養。
10.開(kāi)源系統將成為大數據領(lǐng)域的主流技術(shù)和系統選擇。
(資料來(lái)源:中國大數據技術(shù)大會(huì )發(fā)布的《2015大數據十大發(fā)展趨勢預測》)
生命組學(xué)必將成為開(kāi)啟大發(fā)現新時(shí)代的領(lǐng)航者
畢達哥拉斯學(xué)派開(kāi)啟了科學(xué)的第一個(gè)大發(fā)現時(shí)代。他們集中證明:算術(shù)的本質(zhì)是“絕對的不連續量”,音樂(lè )的本質(zhì)是“相對的不連續量”,幾何的本質(zhì)是“靜止的連續量”,天文學(xué)的本質(zhì)是“運動(dòng)的連續量”,終成“數即萬(wàn)物”學(xué)說(shuō)。
基于第谷終身積累的海量數據,開(kāi)普勒實(shí)現了對太陽(yáng)系幾乎所有天體運動(dòng)規律的高度理論概括,因而被譽(yù)為“天空立法者”。同時(shí)期,伽利略亦通過(guò)大量觀(guān)測,先后發(fā)現了運動(dòng)的第一(勻速)、第二(勻加速)定律,被冠以“近代實(shí)驗科學(xué)精神的創(chuàng )造者”。而開(kāi)普勒、伽利略等的系列大發(fā)現,迅即催生了牛頓的集大成時(shí)代。一時(shí)間,牛頓力學(xué)統一了聲學(xué)、光學(xué)、電磁學(xué)和熱學(xué),“萬(wàn)有”的牛頓定律幾乎支配著(zhù)小到超顯微粒子、大到宇宙天體的整個(gè)物質(zhì)世界。
20世紀是基因的大發(fā)現時(shí)代。1900年,孟德?tīng)栠z傳定律重新發(fā)現;1910年,基因連鎖定律發(fā)現;1944年證明遺傳物質(zhì)為DNA;1952年,DNA堿基組成定律發(fā)現;1953年DNA雙螺旋模型問(wèn)世,它洞開(kāi)了萬(wàn)古遺傳之謎及其遺傳密碼,進(jìn)而揭示了統一萬(wàn)千生命世界的中心法則,并為人類(lèi)基因組計劃提供了理論與技術(shù)基礎。
大科學(xué)研究,不僅開(kāi)啟了大數據時(shí)代,而且也光大了大發(fā)現時(shí)代。例如,人們通過(guò)大型強子對撞機,在不到5年的時(shí)間里,就實(shí)現了對“上帝粒子”(希格斯玻色子)的重大發(fā)現。希格斯玻色子的存在是最新一代大一統理論即“標準模型”的預言,而此模型是統一描述宇宙強力、弱力和電磁力這三種基本力及組成所有物質(zhì)的基本粒子的理論,從而揭示了基本粒子為何擁有質(zhì)量并演化為萬(wàn)事萬(wàn)物的“至理大道”,向人類(lèi)破解宇宙誕生之謎邁進(jìn)了一大步,因此在其發(fā)現的第二年,預言者即被授予諾貝爾獎。而此驚天大發(fā)現出自大設施、源于大科學(xué)、成于大數據、歸于大智慧。它們預示著(zhù)人類(lèi)社會(huì )正在走向集大成的最偉大時(shí)代——智慧時(shí)代。正如莎士比亞所言:凡是過(guò)去,皆為序曲。人類(lèi)的前程又到了一個(gè)新的轉折點(diǎn)。
“人腦是自然界最復雜的系統,認知、意識、情感產(chǎn)生機理是自然科學(xué)的終極疆域,解讀人腦成為國際科技競爭的巔峰戰場(chǎng)”。2013年以來(lái),集大科學(xué)、大數據、大發(fā)現之大成的“人類(lèi)腦計劃”相繼在歐洲、北美洲、亞洲依次展開(kāi)。就像曼哈頓計劃、阿波羅計劃開(kāi)啟了知識經(jīng)濟、信息社會(huì )、大數據時(shí)代一樣,人類(lèi)基因組、蛋白質(zhì)組計劃、腦計劃正開(kāi)啟集大成的最偉大時(shí)代——智慧時(shí)代!
摘自 光明網(wǎng)《光明日報》