科學(xué)家和“co學(xué)家”的思想碰撞
去年《自然-生物技術(shù)》有一篇小文章很有意思,題目是“It takes two to think”。這篇文章的意思簡(jiǎn)單直白,即一個(gè)人的苦思容易走進(jìn)死胡同,而太多人的討論又容易人云亦云,最合適的就是兩個(gè)人的思想碰撞,從而引爆科學(xué)突破。
在科學(xué)界競爭多于合作的今天,找到一位能和自己隨意討論的科學(xué)家同伴并不容易。如果找不到合適的同伴,那么是否可以尋求“無(wú)所不能”的AI呢?當然可以,思想碰撞,也可能是發(fā)生于一位科學(xué)家和另一個(gè)“co學(xué)家”之間。
這一個(gè)“co學(xué)家”全名“coscientist”。這個(gè)AI科學(xué)家智能體的概念于2023年被提出,近期谷歌團隊又將其進(jìn)一步完善,讓它模仿科學(xué)家的思考方式,分析已發(fā)表的論文和數據庫,綜合結果,形成假設,并提出下一步的實(shí)驗設計。
更重要的是,科學(xué)家可以和“co學(xué)家”互動(dòng),提出初始想法,或者對“co學(xué)家”的建議進(jìn)行反饋,最后形成之前所沒(méi)有考慮到的假設。試用過(guò)的科學(xué)家對其能力感到震驚,一度懷疑“co學(xué)家”是不是作弊偷考題了。
訓練AI科學(xué)家最缺語(yǔ)料
一個(gè)好用的AI智能體需要四個(gè)要素——算力、算法、語(yǔ)料和決策。算力的發(fā)展帶來(lái)了ChatGPT,算法的突破帶來(lái)了DeepSeek,而決策的百花齊放則帶來(lái)了Manus等智能體。
訓練AI科學(xué)家智能體最缺語(yǔ)料。訓練一個(gè)研究生從讀文獻開(kāi)始,訓練AI科學(xué)家智能體也差不多。AI科學(xué)家需要的語(yǔ)料不僅僅是課本上的老知識,更重要的是科學(xué)論文中的新知識??蒲姓撐木唧w統一的格式、嚴格的論證、全方位的覆蓋、專(zhuān)業(yè)人士的評估、持續不斷的更新……毫無(wú)疑問(wèn)是非常好的AI訓練語(yǔ)料。
理論上,新的論文不斷產(chǎn)生,訓練AI科學(xué)家智能體的語(yǔ)料永不枯竭。但是隨著(zhù)我們越來(lái)越認識到語(yǔ)料對于訓練AI的重要性,開(kāi)始出現了一個(gè)奇怪的局面,就是越來(lái)越多的知識、數據被各種機構“圈養”,從而不能被使用。于是,一方面,公有語(yǔ)料因為高度重復而價(jià)值下降;另一方面,私有數據被各自的“護城河”保護而束之高閣。
有人認為阻礙科學(xué)論文成為AI訓練語(yǔ)料的主要因素是付費墻,這觀(guān)點(diǎn)也對,也不對。當科學(xué)家把論文提交給期刊,并通過(guò)同行評議得以發(fā)表之后,期刊會(huì )組織人員對論文進(jìn)行編輯,從而擁有了編輯后的論文版權。其他人如果要閱讀這篇論文,需要支付給出版社相當高的費用。
我認為,Perplexity是目前最好用的、AI幻覺(jué)最少的科學(xué)問(wèn)答AI,當它回答科學(xué)問(wèn)題時(shí),會(huì )列出真實(shí)科學(xué)文獻作為佐證。然而,為了繞過(guò)付費墻,這些論文基本上都是開(kāi)放獲取的,即作者付費、讀者免費使用的論文。
具有諷刺意義的是,這里面有大量MDPI和Frontiers旗下的期刊論文。被認為是掠奪性期刊大本營(yíng)的兩家雜志社,居然成為AI時(shí)代的香餑餑。而當年為了畢業(yè)不得不在這些期刊中“灌水”的學(xué)生們,也沒(méi)有想到自己的論文真真切切地推動(dòng)了科學(xué)發(fā)展吧?
事實(shí)上,出版社壟斷的并不是論文,確切說(shuō),出版社壟斷的只是編輯后的論文。這就好比科學(xué)工作者們辛苦炒好了菜后,出版社拿到菜,挑了最好吃的一批,撒上蔥花,從而擁有了版權。沒(méi)有蔥花的論文可以自由分發(fā),但撒了蔥花的論文就不行了。
2022年,我們就成為了世界第一論文發(fā)表大國,與此同時(shí),我們卻是一個(gè)論文版權小國。我們貢獻了大量論文,卻讀不起科研論文,更不要說(shuō)用科學(xué)家發(fā)表的論文訓練AI科學(xué)家。因為這些語(yǔ)料的限制,像誕生DeepSeek這樣的“超車(chē)時(shí)刻”,在很長(cháng)一段時(shí)間可能會(huì )很難發(fā)生在中國的AI科學(xué)家智能體上。
這也不是我們獨家的問(wèn)題,全世界的科學(xué)家都苦期刊久矣,甚至開(kāi)始有組織地拒絕為某些期刊審稿。
重塑科學(xué)交流體系
為了解決付費墻的問(wèn)題,出版社提倡開(kāi)放獲取,但讓作者付費的開(kāi)放獲取加重了發(fā)表者的負擔,也使得缺少經(jīng)費的課題組更難發(fā)表成果??茖W(xué)家們則搭建了各種類(lèi)型的預印本平臺,這些預印本平臺接收未經(jīng)同行評議的論文,上傳即公開(kāi),可以第一時(shí)間分享科研成果;但缺少了同行評議,使得其部分論文粗制濫造。
顯然,不管是開(kāi)放獲取還是預印本都不夠完美。
現在基于期刊的論文發(fā)表模式是百年前的產(chǎn)物,近20年來(lái),我們的信息交流方式早已從單純紙媒快速轉變成基于文字、圖片、影像等的交流方式。在技術(shù)浪潮下,期刊終將消亡,現在的問(wèn)題是:未來(lái)的知識,將以什么方式沉淀,又由什么方式流通?
AI的發(fā)展或許是重塑現有論文發(fā)表和交流方式的機遇。
論文發(fā)表最重要的節點(diǎn)是同行評議,審稿人一般需要通過(guò)四個(gè)維度評估論文:方法可靠性、內容可讀性、結果創(chuàng )新性和影響力。前兩個(gè)維度,代表了一篇科學(xué)論文的最低標準,如果沒(méi)有達到即不能發(fā)表,在這兩個(gè)維度上,AI的表現已經(jīng)和人類(lèi)相當,甚至超出了人類(lèi),完全可以替代部分審稿人的工作。
后兩個(gè)維度,代表了不同期刊的標準,頂級期刊往往要求非常高的創(chuàng )新性和影響力。也有期刊反其道而行之,不要求評審人對創(chuàng )新性和影響力進(jìn)行評估,比如Scientific Reports和Peer J。這些新型期刊有自己的理由:一項工作的創(chuàng )新性和影響力很難由少數幾個(gè)評審人準確判斷,應當交給時(shí)間和廣大的科學(xué)共同體評判。
由于長(cháng)時(shí)間形成的慣例,出版社和期刊主導了科研成果傳播的同行評議?;蛟S是時(shí)候成立一個(gè)國際性的科學(xué)組織重塑整個(gè)科學(xué)交流體系了,給沒(méi)有“撒蔥花”的論文搭建一個(gè)可以發(fā)光發(fā)熱的平臺。而作為世界論文發(fā)表大國、在新媒體領(lǐng)域蓬勃發(fā)展的國家,也是迫切希望建立新的科學(xué)評估體系的國家,中國必然在其中扮演重要角色。
來(lái)源:《中國科學(xué)報》