久久久国产99久_AI科學(xué)家與后 AI 時(shí)代科研-資訊-控制網(wǎng)

AI科學(xué)家與后 AI 時(shí)代科研

點(diǎn)擊數：13 發(fā)布時(shí)間：2025-05-22 17:16:14
分享到：

在科學(xué)界競爭多于合作的今天，找到一位能和自己隨意討論的科學(xué)家同伴并不容易。如果找不到合適的同伴，那么是否可以尋求“無(wú)所不能”的AI呢？當然可以，思想碰撞，也可能是發(fā)生于一位科學(xué)家和另一個(gè)“co學(xué)家”之間。

關(guān)鍵詞： AI , AI科學(xué)家 , co學(xué)家

科學(xué)家和“co學(xué)家”的思想碰撞

去年《自然-生物技術(shù)》有一篇小文章很有意思，題目是“It takes two to think”。這篇文章的意思簡(jiǎn)單直白，即一個(gè)人的苦思容易走進(jìn)死胡同，而太多人的討論又容易人云亦云，最合適的就是兩個(gè)人的思想碰撞，從而引爆科學(xué)突破。

這一個(gè)“co學(xué)家”全名“coscientist”。這個(gè)AI科學(xué)家智能體的概念于2023年被提出，近期谷歌團隊又將其進(jìn)一步完善，讓它模仿科學(xué)家的思考方式，分析已發(fā)表的論文和數據庫，綜合結果，形成假設，并提出下一步的實(shí)驗設計。

更重要的是，科學(xué)家可以和“co學(xué)家”互動(dòng)，提出初始想法，或者對“co學(xué)家”的建議進(jìn)行反饋，最后形成之前所沒(méi)有考慮到的假設。試用過(guò)的科學(xué)家對其能力感到震驚，一度懷疑“co學(xué)家”是不是作弊偷考題了。

訓練AI科學(xué)家最缺語(yǔ)料

一個(gè)好用的AI智能體需要四個(gè)要素——算力、算法、語(yǔ)料和決策。算力的發(fā)展帶來(lái)了ChatGPT，算法的突破帶來(lái)了DeepSeek，而決策的百花齊放則帶來(lái)了Manus等智能體。

訓練AI科學(xué)家智能體最缺語(yǔ)料。訓練一個(gè)研究生從讀文獻開(kāi)始，訓練AI科學(xué)家智能體也差不多。AI科學(xué)家需要的語(yǔ)料不僅僅是課本上的老知識，更重要的是科學(xué)論文中的新知識?？蒲姓撐木唧w統一的格式、嚴格的論證、全方位的覆蓋、專(zhuān)業(yè)人士的評估、持續不斷的更新……毫無(wú)疑問(wèn)是非常好的AI訓練語(yǔ)料。

理論上，新的論文不斷產(chǎn)生，訓練AI科學(xué)家智能體的語(yǔ)料永不枯竭。但是隨著(zhù)我們越來(lái)越認識到語(yǔ)料對于訓練AI的重要性，開(kāi)始出現了一個(gè)奇怪的局面，就是越來(lái)越多的知識、數據被各種機構“圈養”，從而不能被使用。于是，一方面，公有語(yǔ)料因為高度重復而價(jià)值下降；另一方面，私有數據被各自的“護城河”保護而束之高閣。

有人認為阻礙科學(xué)論文成為AI訓練語(yǔ)料的主要因素是付費墻，這觀(guān)點(diǎn)也對，也不對。當科學(xué)家把論文提交給期刊，并通過(guò)同行評議得以發(fā)表之后，期刊會(huì )組織人員對論文進(jìn)行編輯，從而擁有了編輯后的論文版權。其他人如果要閱讀這篇論文，需要支付給出版社相當高的費用。

我認為，Perplexity是目前最好用的、AI幻覺(jué)最少的科學(xué)問(wèn)答AI，當它回答科學(xué)問(wèn)題時(shí)，會(huì )列出真實(shí)科學(xué)文獻作為佐證。然而，為了繞過(guò)付費墻，這些論文基本上都是開(kāi)放獲取的，即作者付費、讀者免費使用的論文。

具有諷刺意義的是，這里面有大量MDPI和Frontiers旗下的期刊論文。被認為是掠奪性期刊大本營(yíng)的兩家雜志社，居然成為AI時(shí)代的香餑餑。而當年為了畢業(yè)不得不在這些期刊中“灌水”的學(xué)生們，也沒(méi)有想到自己的論文真真切切地推動(dòng)了科學(xué)發(fā)展吧？

事實(shí)上，出版社壟斷的并不是論文，確切說(shuō)，出版社壟斷的只是編輯后的論文。這就好比科學(xué)工作者們辛苦炒好了菜后，出版社拿到菜，挑了最好吃的一批，撒上蔥花，從而擁有了版權。沒(méi)有蔥花的論文可以自由分發(fā)，但撒了蔥花的論文就不行了。

2022年，我們就成為了世界第一論文發(fā)表大國，與此同時(shí)，我們卻是一個(gè)論文版權小國。我們貢獻了大量論文，卻讀不起科研論文，更不要說(shuō)用科學(xué)家發(fā)表的論文訓練AI科學(xué)家。因為這些語(yǔ)料的限制，像誕生DeepSeek這樣的“超車(chē)時(shí)刻”，在很長(cháng)一段時(shí)間可能會(huì )很難發(fā)生在中國的AI科學(xué)家智能體上。

這也不是我們獨家的問(wèn)題，全世界的科學(xué)家都苦期刊久矣，甚至開(kāi)始有組織地拒絕為某些期刊審稿。

重塑科學(xué)交流體系

為了解決付費墻的問(wèn)題，出版社提倡開(kāi)放獲取，但讓作者付費的開(kāi)放獲取加重了發(fā)表者的負擔，也使得缺少經(jīng)費的課題組更難發(fā)表成果?？茖W(xué)家們則搭建了各種類(lèi)型的預印本平臺，這些預印本平臺接收未經(jīng)同行評議的論文，上傳即公開(kāi)，可以第一時(shí)間分享科研成果；但缺少了同行評議，使得其部分論文粗制濫造。

顯然，不管是開(kāi)放獲取還是預印本都不夠完美。

現在基于期刊的論文發(fā)表模式是百年前的產(chǎn)物，近20年來(lái)，我們的信息交流方式早已從單純紙媒快速轉變成基于文字、圖片、影像等的交流方式。在技術(shù)浪潮下，期刊終將消亡，現在的問(wèn)題是：未來(lái)的知識，將以什么方式沉淀，又由什么方式流通？

AI的發(fā)展或許是重塑現有論文發(fā)表和交流方式的機遇。

論文發(fā)表最重要的節點(diǎn)是同行評議，審稿人一般需要通過(guò)四個(gè)維度評估論文：方法可靠性、內容可讀性、結果創(chuàng )新性和影響力。前兩個(gè)維度，代表了一篇科學(xué)論文的最低標準，如果沒(méi)有達到即不能發(fā)表，在這兩個(gè)維度上，AI的表現已經(jīng)和人類(lèi)相當，甚至超出了人類(lèi)，完全可以替代部分審稿人的工作。

后兩個(gè)維度，代表了不同期刊的標準，頂級期刊往往要求非常高的創(chuàng )新性和影響力。也有期刊反其道而行之，不要求評審人對創(chuàng )新性和影響力進(jìn)行評估，比如Scientific Reports和Peer J。這些新型期刊有自己的理由：一項工作的創(chuàng )新性和影響力很難由少數幾個(gè)評審人準確判斷，應當交給時(shí)間和廣大的科學(xué)共同體評判。

由于長(cháng)時(shí)間形成的慣例，出版社和期刊主導了科研成果傳播的同行評議?；蛟S是時(shí)候成立一個(gè)國際性的科學(xué)組織重塑整個(gè)科學(xué)交流體系了，給沒(méi)有“撒蔥花”的論文搭建一個(gè)可以發(fā)光發(fā)熱的平臺。而作為世界論文發(fā)表大國、在新媒體領(lǐng)域蓬勃發(fā)展的國家，也是迫切希望建立新的科學(xué)評估體系的國家，中國必然在其中扮演重要角色。

來(lái)源：《中國科學(xué)報》

1.我有以下需求：
得到貴公司產(chǎn)品詳細資料得到貴公司產(chǎn)品的價(jià)格信息貴公司產(chǎn)品銷(xiāo)售人員聯(lián)系我貴公司技術(shù)支持人員聯(lián)系我
2.詳細的需求：
*
姓名:	*
單位:
電話(huà):	*
郵件:	*

技術(shù)頻道

行業(yè)頻道

熱門(mén)頻道

技術(shù)頻道

行業(yè)頻道

熱門(mén)頻道

資訊頻道

熱點(diǎn)新聞

推薦產(chǎn)品