隨著人工智能大模型的不斷發(fā)展,如何讓其在“難”的問題上深入思考,而不是對所有問題“想個不停”?記者5月29日從中國科學(xué)院自動化研究所獲悉,該所聯(lián)合鵬城實(shí)驗(yàn)室提出了一種高效推理策略AutoThink,可讓大模型實(shí)現(xiàn)自主切換思考模式,避免“過度思考”。
“當(dāng)前,越來越多的大模型開始具備‘深度思考能力’。”中國科學(xué)院自動化研究所研究員張啟超說,模型在回答問題之前要先生成一整段包含反復(fù)自我反思、自我驗(yàn)證的推理過程,然后再給出答案。
張啟超表示,這一思考模式顯著提升了大模型解決復(fù)雜問題的能力,但同時也帶來了“過度思考”的問題,即在處理簡單任務(wù)時也會生成冗余的思考過程。
“比如使用者對大模型提問‘2+3等于幾’,大模型可能會從自然數(shù)定義講起,列出加法交換律,甚至反復(fù)確認(rèn),最后才輸出答案是5。”張啟超說,這種不必要的“過度思考”現(xiàn)象在推理模型中廣泛存在。
針對這一問題,AutoThink可賦予推理模型根據(jù)題目難度自主切換思考模式的能力,即通過所設(shè)計的提示詞和多階段強(qiáng)化學(xué)習(xí),引導(dǎo)其自主決定是否進(jìn)行深度思考。
張啟超介紹,AutoThink提供了一種簡單而有效的推理新范式——通過省略號提示配合三階段強(qiáng)化學(xué)習(xí),引導(dǎo)大模型不再“逢題必深思熟慮”,而是根據(jù)問題難度自主決定“是否思考”“思考多少”。在多個數(shù)學(xué)數(shù)據(jù)集上,AutoThink實(shí)現(xiàn)了準(zhǔn)確率與效率平衡,既提升性能又節(jié)省算力,展示出較強(qiáng)的適應(yīng)性和實(shí)用性。
據(jù)悉,AutoThink已集成于一站式智能科研平臺ScienceOne,并將用于訓(xùn)練ScienceOne的基座大模型S1-Base。研發(fā)團(tuán)隊表示,讓大模型“更聰明地思考、更簡潔地表達(dá)”,是未來科學(xué)基礎(chǔ)大模型演進(jìn)的重要方向。
隨著人工智能大模型的不斷發(fā)展,如何讓其在“難”的問題上深入思考,而不是對所有問題“想個不停”?記者5月29日從中國科學(xué)院自動化研究所獲悉,該所聯(lián)合鵬城實(shí)驗(yàn)室提出了一種高效推理策略AutoThink,可讓大模型實(shí)現(xiàn)自主切換思考模式,避免“過度思考”。
“當(dāng)前,越來越多的大模型開始具備‘深度思考能力’。”中國科學(xué)院自動化研究所研究員張啟超說,模型在回答問題之前要先生成一整段包含反復(fù)自我反思、自我驗(yàn)證的推理過程,然后再給出答案。
張啟超表示,這一思考模式顯著提升了大模型解決復(fù)雜問題的能力,但同時也帶來了“過度思考”的問題,即在處理簡單任務(wù)時也會生成冗余的思考過程。
“比如使用者對大模型提問‘2+3等于幾’,大模型可能會從自然數(shù)定義講起,列出加法交換律,甚至反復(fù)確認(rèn),最后才輸出答案是5。”張啟超說,這種不必要的“過度思考”現(xiàn)象在推理模型中廣泛存在。
針對這一問題,AutoThink可賦予推理模型根據(jù)題目難度自主切換思考模式的能力,即通過所設(shè)計的提示詞和多階段強(qiáng)化學(xué)習(xí),引導(dǎo)其自主決定是否進(jìn)行深度思考。
張啟超介紹,AutoThink提供了一種簡單而有效的推理新范式——通過省略號提示配合三階段強(qiáng)化學(xué)習(xí),引導(dǎo)大模型不再“逢題必深思熟慮”,而是根據(jù)問題難度自主決定“是否思考”“思考多少”。在多個數(shù)學(xué)數(shù)據(jù)集上,AutoThink實(shí)現(xiàn)了準(zhǔn)確率與效率平衡,既提升性能又節(jié)省算力,展示出較強(qiáng)的適應(yīng)性和實(shí)用性。
據(jù)悉,AutoThink已集成于一站式智能科研平臺ScienceOne,并將用于訓(xùn)練ScienceOne的基座大模型S1-Base。研發(fā)團(tuán)隊表示,讓大模型“更聰明地思考、更簡潔地表達(dá)”,是未來科學(xué)基礎(chǔ)大模型演進(jìn)的重要方向。
本文鏈接:http://www.lbgj202.com/v-146-957.html我國科學(xué)家提出高效推理策略 可避免大模型“過度思考”
相關(guān)文章:
人工智能教育指南深意何在05-16
話的經(jīng)典語錄摘錄88條09-13
簡短經(jīng)典語錄99條08-10
學(xué)生會部門的工作總結(jié)1000字 學(xué)生會部門工作總結(jié)匯報(14篇)09-30
普法進(jìn)社區(qū)活動策劃書11-27
拾金不昧表揚(yáng)信08-17
賓館的轉(zhuǎn)讓協(xié)議書08-02
出納競聘演講稿01-19
工程類個人簡歷01-12
中考滿分作文:生活,是一面鏡子01-15
五年級跳繩比賽作文450字01-07
《牧童》改寫作文12-17
員工個人辭職申請書參考11-26
吉林2024年證券從業(yè)資格考試合格標(biāo)準(zhǔn):60分11-21
三國志毋丘儉傳原文翻譯11-16
應(yīng)屆生到國企應(yīng)聘面試自我介紹03-12
立冬文案干凈治愈11-09
大一學(xué)習(xí)計劃10-26
高中生暑假社會實(shí)踐報告08-23