2024年春的一天,美國斯坦福大學(xué)病理學(xué)家托馬斯·蒙廷開啟了一場前所未有的“實驗室會議”——與6位由人工智能(AI)驅(qū)動的“虛擬科學(xué)家”共商阿爾茨海默病的治療策略。這些AI被賦予不同的專業(yè)角色,從神經(jīng)科學(xué)家到藥物化學(xué)家,在幾分鐘內(nèi)展開多輪討論,最終生成了一份長達(dá)一萬多字的會議紀(jì)要。這場看似科幻的情景,其實是一個新興趨勢的縮影:以多智能體語言模型組成“AI科研團(tuán)隊”,模擬真實研究協(xié)作過程,幫助科學(xué)家節(jié)省時間、完善假設(shè),甚至激發(fā)新的科學(xué)靈感。開發(fā)者稱這種系統(tǒng)為“聯(lián)合科學(xué)家”。
多家機(jī)構(gòu)打造“虛擬實驗室”
今年2月,谷歌旗下“深度思維”公司推出了一款名為“AI聯(lián)合科學(xué)家”的軟件。該軟件由6個AI代理組成,分別負(fù)責(zé)想法生成、反思或批評、概念演進(jìn)、去重、排序和總結(jié)審稿,均由谷歌的Gemini 2.0模型驅(qū)動。這套系統(tǒng)是谷歌生物醫(yī)學(xué)AI研究工作的延伸。在一項早期測試中,該系統(tǒng)在兩天內(nèi)就解決了困擾科學(xué)家十多年的科學(xué)謎題。
美國斯坦福大學(xué)也在去年11月推出了“虛擬實驗室”系統(tǒng),蒙廷試用的正是這個版本??萍济襟wFreethink網(wǎng)站報道稱,目前,該系統(tǒng)以O(shè)penAI的GPT-4o為基礎(chǔ),默認(rèn)配備“首席研究員”和“評論者”兩個角色,用戶可自由添加更多代理并設(shè)定他們的專業(yè)領(lǐng)域,快速生成模擬會議記錄。
在中國,上海人工智能實驗室的研究團(tuán)隊也在開發(fā)虛擬科學(xué)家系統(tǒng),名為“VirSci”,專注于模擬科學(xué)家團(tuán)隊的合作過程,以推動科研創(chuàng)新。
英國《自然》雜志報道稱,這些系統(tǒng)所用的大型語言模型(LLM)不僅僅是在“你一言我一語”地交換觀點(diǎn),它們還具備聯(lián)網(wǎng)檢索信息、執(zhí)行代碼、調(diào)用專業(yè)工具等功能,屬于一種“代理式AI”系統(tǒng)。這一術(shù)語目前尚不嚴(yán)格,但一般指LLM在一定程度上能自主承擔(dān)任務(wù)。美國阿貢國家實驗室的計算機(jī)科學(xué)家里克·史蒂文斯指出,多個AI代理協(xié)同作戰(zhàn),可連續(xù)數(shù)小時專注于解決復(fù)雜科學(xué)問題,不會走神,也不會疲憊。
AI科研團(tuán)隊是否靠譜
那么問題來了:這些AI之間的對話,像是一屋子的諾貝爾獎得主,還是一群本科生?它們的想法是天方夜譚、空洞無趣,還是令人振奮、值得深挖?
現(xiàn)階段的AI代理系統(tǒng)確實存在“幻覺”問題,即生成錯誤或虛構(gòu)的信息。但芝加哥大學(xué)計算機(jī)科學(xué)家史蒂文斯指出,通過引入“評論者”或“評審者”的角色,系統(tǒng)往往能有效篩除不合理內(nèi)容,提升整體可靠性。他還認(rèn)為,即便是“幻覺”,在頭腦風(fēng)暴場景下也可能激發(fā)出意想不到的創(chuàng)意,前提是有專家把關(guān)。
現(xiàn)有研究也發(fā)現(xiàn),多代理協(xié)作確實優(yōu)于單一AI。以GPT-4o為例,斯坦福大學(xué)團(tuán)隊發(fā)現(xiàn),若在對話中加入一名“評論者”,該模型在研究生水平的科學(xué)測試中的表現(xiàn)會提高幾個百分點(diǎn),在實際科研應(yīng)用中的回答也更加精準(zhǔn),例如在放射治療方案設(shè)計方面更具邏輯。
谷歌也曾對其聯(lián)合科學(xué)家系統(tǒng)展開評估,結(jié)果顯示,人類專家更傾向于由多個AI協(xié)作生成的回答,認(rèn)為其更具新意和科研潛力。
關(guān)于多少名AI代理、幾輪互動最為有效,科學(xué)界也正在尋找答案。上海人工智能實驗室計算機(jī)科學(xué)家董楠卿等人開發(fā)VirSci系統(tǒng)時發(fā)現(xiàn),最佳創(chuàng)造力出現(xiàn)在“8個代理人×每人5輪發(fā)言”的設(shè)置下。而斯坦福大學(xué)的斯旺森則表示,超過3個專家后輸出常常變得冗余,3輪之后系統(tǒng)也容易跑題。
AI的點(diǎn)子到底有多新
谷歌在宣布其聯(lián)合科學(xué)家系統(tǒng)時表示,該系統(tǒng)幫助研究者提出了“新穎的預(yù)測”。例如,斯坦福大學(xué)的加里·佩爾茨用谷歌的“AI聯(lián)合科學(xué)家”系統(tǒng)尋找治療肝纖維化的新藥時,AI團(tuán)隊在分析背景信息后提出3種藥物建議,其中2種在實驗中顯示出療效,反而優(yōu)于他自己挑選的方案。但同時,一些科學(xué)家則認(rèn)為這些建議其實“談不上什么新意”。
類似的爭議也出現(xiàn)在帝國理工學(xué)院微生物學(xué)家何塞·佩納德斯團(tuán)隊測試谷歌系統(tǒng)時。AI在閱讀背景文獻(xiàn)后,提出了一種未見于任何文獻(xiàn)的新假設(shè):移動遺傳元件可“跨細(xì)胞偷取”噬菌體尾部。這一觀點(diǎn)挑戰(zhàn)主流,卻與該團(tuán)隊通過未公開實驗得出的結(jié)論一致。佩納德斯認(rèn)為,盡管AI只是把已有信息作了一個“顯而易見”的推理,但其本身就是科學(xué)進(jìn)步。
《自然》雜志指出,這類AI系統(tǒng)目前更像是一種科研助理:它們通過總結(jié)資料、激發(fā)靈感、提出新角度或查漏補(bǔ)缺,幫助研究者節(jié)省時間,提高效率。但是否能催生真正顛覆性的想法,還需長期驗證。
目前,這類多智能體語言模型系統(tǒng)尚未以大眾化、便捷的方式廣泛提供。但研究人員普遍認(rèn)為,AI聯(lián)合科學(xué)家終將成為科研日常的一部分,就像搜索引擎一樣,不過這并不意味著它能取代人類。史蒂文斯提醒,如果年輕科研人員過度依賴AI,可能會損害其自主思考和學(xué)習(xí)能力。西班牙癌癥研究者巴里加也表示,過度依賴AI,就如同把思考過程“外包”,而那正是科研中最有趣的部分。
2024年春的一天,美國斯坦福大學(xué)病理學(xué)家托馬斯·蒙廷開啟了一場前所未有的“實驗室會議”——與6位由人工智能(AI)驅(qū)動的“虛擬科學(xué)家”共商阿爾茨海默病的治療策略。這些AI被賦予不同的專業(yè)角色,從神經(jīng)科學(xué)家到藥物化學(xué)家,在幾分鐘內(nèi)展開多輪討論,最終生成了一份長達(dá)一萬多字的會議紀(jì)要。這場看似科幻的情景,其實是一個新興趨勢的縮影:以多智能體語言模型組成“AI科研團(tuán)隊”,模擬真實研究協(xié)作過程,幫助科學(xué)家節(jié)省時間、完善假設(shè),甚至激發(fā)新的科學(xué)靈感。開發(fā)者稱這種系統(tǒng)為“聯(lián)合科學(xué)家”。
多家機(jī)構(gòu)打造“虛擬實驗室”
今年2月,谷歌旗下“深度思維”公司推出了一款名為“AI聯(lián)合科學(xué)家”的軟件。該軟件由6個AI代理組成,分別負(fù)責(zé)想法生成、反思或批評、概念演進(jìn)、去重、排序和總結(jié)審稿,均由谷歌的Gemini 2.0模型驅(qū)動。這套系統(tǒng)是谷歌生物醫(yī)學(xué)AI研究工作的延伸。在一項早期測試中,該系統(tǒng)在兩天內(nèi)就解決了困擾科學(xué)家十多年的科學(xué)謎題。
美國斯坦福大學(xué)也在去年11月推出了“虛擬實驗室”系統(tǒng),蒙廷試用的正是這個版本??萍济襟wFreethink網(wǎng)站報道稱,目前,該系統(tǒng)以O(shè)penAI的GPT-4o為基礎(chǔ),默認(rèn)配備“首席研究員”和“評論者”兩個角色,用戶可自由添加更多代理并設(shè)定他們的專業(yè)領(lǐng)域,快速生成模擬會議記錄。
在中國,上海人工智能實驗室的研究團(tuán)隊也在開發(fā)虛擬科學(xué)家系統(tǒng),名為“VirSci”,專注于模擬科學(xué)家團(tuán)隊的合作過程,以推動科研創(chuàng)新。
英國《自然》雜志報道稱,這些系統(tǒng)所用的大型語言模型(LLM)不僅僅是在“你一言我一語”地交換觀點(diǎn),它們還具備聯(lián)網(wǎng)檢索信息、執(zhí)行代碼、調(diào)用專業(yè)工具等功能,屬于一種“代理式AI”系統(tǒng)。這一術(shù)語目前尚不嚴(yán)格,但一般指LLM在一定程度上能自主承擔(dān)任務(wù)。美國阿貢國家實驗室的計算機(jī)科學(xué)家里克·史蒂文斯指出,多個AI代理協(xié)同作戰(zhàn),可連續(xù)數(shù)小時專注于解決復(fù)雜科學(xué)問題,不會走神,也不會疲憊。
AI科研團(tuán)隊是否靠譜
那么問題來了:這些AI之間的對話,像是一屋子的諾貝爾獎得主,還是一群本科生?它們的想法是天方夜譚、空洞無趣,還是令人振奮、值得深挖?
現(xiàn)階段的AI代理系統(tǒng)確實存在“幻覺”問題,即生成錯誤或虛構(gòu)的信息。但芝加哥大學(xué)計算機(jī)科學(xué)家史蒂文斯指出,通過引入“評論者”或“評審者”的角色,系統(tǒng)往往能有效篩除不合理內(nèi)容,提升整體可靠性。他還認(rèn)為,即便是“幻覺”,在頭腦風(fēng)暴場景下也可能激發(fā)出意想不到的創(chuàng)意,前提是有專家把關(guān)。
現(xiàn)有研究也發(fā)現(xiàn),多代理協(xié)作確實優(yōu)于單一AI。以GPT-4o為例,斯坦福大學(xué)團(tuán)隊發(fā)現(xiàn),若在對話中加入一名“評論者”,該模型在研究生水平的科學(xué)測試中的表現(xiàn)會提高幾個百分點(diǎn),在實際科研應(yīng)用中的回答也更加精準(zhǔn),例如在放射治療方案設(shè)計方面更具邏輯。
谷歌也曾對其聯(lián)合科學(xué)家系統(tǒng)展開評估,結(jié)果顯示,人類專家更傾向于由多個AI協(xié)作生成的回答,認(rèn)為其更具新意和科研潛力。
關(guān)于多少名AI代理、幾輪互動最為有效,科學(xué)界也正在尋找答案。上海人工智能實驗室計算機(jī)科學(xué)家董楠卿等人開發(fā)VirSci系統(tǒng)時發(fā)現(xiàn),最佳創(chuàng)造力出現(xiàn)在“8個代理人×每人5輪發(fā)言”的設(shè)置下。而斯坦福大學(xué)的斯旺森則表示,超過3個專家后輸出常常變得冗余,3輪之后系統(tǒng)也容易跑題。
AI的點(diǎn)子到底有多新
谷歌在宣布其聯(lián)合科學(xué)家系統(tǒng)時表示,該系統(tǒng)幫助研究者提出了“新穎的預(yù)測”。例如,斯坦福大學(xué)的加里·佩爾茨用谷歌的“AI聯(lián)合科學(xué)家”系統(tǒng)尋找治療肝纖維化的新藥時,AI團(tuán)隊在分析背景信息后提出3種藥物建議,其中2種在實驗中顯示出療效,反而優(yōu)于他自己挑選的方案。但同時,一些科學(xué)家則認(rèn)為這些建議其實“談不上什么新意”。
類似的爭議也出現(xiàn)在帝國理工學(xué)院微生物學(xué)家何塞·佩納德斯團(tuán)隊測試谷歌系統(tǒng)時。AI在閱讀背景文獻(xiàn)后,提出了一種未見于任何文獻(xiàn)的新假設(shè):移動遺傳元件可“跨細(xì)胞偷取”噬菌體尾部。這一觀點(diǎn)挑戰(zhàn)主流,卻與該團(tuán)隊通過未公開實驗得出的結(jié)論一致。佩納德斯認(rèn)為,盡管AI只是把已有信息作了一個“顯而易見”的推理,但其本身就是科學(xué)進(jìn)步。
《自然》雜志指出,這類AI系統(tǒng)目前更像是一種科研助理:它們通過總結(jié)資料、激發(fā)靈感、提出新角度或查漏補(bǔ)缺,幫助研究者節(jié)省時間,提高效率。但是否能催生真正顛覆性的想法,還需長期驗證。
目前,這類多智能體語言模型系統(tǒng)尚未以大眾化、便捷的方式廣泛提供。但研究人員普遍認(rèn)為,AI聯(lián)合科學(xué)家終將成為科研日常的一部分,就像搜索引擎一樣,不過這并不意味著它能取代人類。史蒂文斯提醒,如果年輕科研人員過度依賴AI,可能會損害其自主思考和學(xué)習(xí)能力。西班牙癌癥研究者巴里加也表示,過度依賴AI,就如同把思考過程“外包”,而那正是科研中最有趣的部分。
本文鏈接:http://www.lbgj202.com/v-146-3228.htmlAI“聯(lián)合科學(xué)家”重塑科研協(xié)作方式
相關(guān)文章:
朋友圈情感句子36條03-10
簡短的簡短經(jīng)典語錄79條10-05
學(xué)前班安全工作總結(jié)上學(xué)期(精選六篇)01-10
中秋活動計劃中班11-14
醫(yī)院職工收入證明02-06
大學(xué)實訓(xùn)心得體會10-28
暑假通知書08-02
難過的歌詞1條11-09
描寫三亞早晨的作文10-19
草房子的好詞好句好段10-05
青島濱海學(xué)院學(xué)費(fèi)貴嗎 大概招生多少人07-27
一年級美術(shù)課教案10-23
夏天成語01-07
《買花》白居易古詩原文翻譯及鑒賞12-07
秋季運(yùn)動會日記12-30
房地產(chǎn)銷售晨會口號10-18