不會數學了！GPT-4“智力”大幅下降

投稿用戶 ? 2024年4月20日下午12:09 ? 科研百科 ? 閱讀 35

參考消息網7月22日報道 據美國《財富》雜志網站7月20日報道，斯坦福大學的一項研究發現，廣受關注的聊天機器人ChatGPT在6月份執行某些任務的表現比3月份的時候變得更糟了。

該研究對由開放人工智能研究中心(OpenAI)創造的這款聊天機器人數月時間內在執行4項“差異化”任務——解數學題、回答敏感問題、編寫軟件代碼、視覺推理——的表現進行了比較。

研究人員發現這項技術執行某些任務的能力存在巨大波動——即“漂移”。該研究考察了OpenAI技術在這一時間段的兩個版本：GPT-3.5和GPT-4。最值得注意的結果來自對GPT-4解答數學題能力的研究。在研究過程中，研究人員發現，在3月份時GPT-4能夠在97.6%的答題時間里正確識別出數字17077為質數。但是僅僅3個月后，其答題的正確率卻驟降至極低的2.4%。與此同時，GPT-3.5的表現軌跡則幾乎相反，其在3月時回答同一問題的正確率僅為7.4%，而在6月時的回答大多是正確的，答題正確率達86.8%。

當研究人員要求這兩個版本編寫代碼和接受視覺推理測試——即要求該技術預測某個圖案中的下一個形象——時，出現了類似的差異化結果。

研究報告的作者之一、斯坦福大學計算機科學教授詹姆斯·鄒(音)說，“如此巨大的差異程度”對于“尖端的ChatGPT”而言是意想不到的。

詹姆斯·鄒說：“當我們在對大型語言模式進行調整，以改善其在某些任務中的表現時，這樣做實際上可能會有許多意想不到的后果，它們或許會影響這個模型在處理其他任務時的表現。在人工智能模型如何回答問題方面，存在各式各樣耐人尋味的相互依賴，它們可能在一定程度上導致我們所觀察到的這些每況愈下的表現?！?/p>

贊 (0)

投稿用戶

全省黨校（行政學院）系統創立優秀教學科研咨詢成果評審機制（全國黨校系統優秀科研成果）

上一篇 2024年4月20日下午12:03

哪些項目可以使用競爭性磋商服務？（哪些項目可以使用競爭性磋商服務項目）

下一篇 2024年4月20日下午12:15

首都博物館科研項目

首都博物館科研項目首都博物館科研項目是當前博物館領域的一項重要工作，旨在通過科研項目的形式，對博物館的陳列進行更深入的研究和改進。本次科研項目的主題為“古代中國農業”，旨在通過…

科研百科 2025年4月26日
10
如何創新黨建教育新模式？一起來看看吧（創新黨建教育方式）

如今在“互聯網 ”快速發展的大背景下，超級隊長將VR技術應用于傳統黨建理論知識學習以及黨建工作中去，通過VR技術真實演繹再現了歷史場景，以震撼的效果傳達先輩精神，使我們身臨其境重溫…

科研百科 2023年3月2日
2030
大眾項目管理面試

大眾項目管理面試：如何準備和應對隨著大眾項目管理在汽車、航空、建筑等行業的廣泛應用，大眾項目管理面試也越來越受到企業和求職者的關注。在面試中，如何準備和應對大眾項目管理面試是非常…

科研百科 2025年7月25日
10
科研項目在同領域評價

科研項目在同領域評價隨著科技的不斷發展，科研項目在各個領域都得到了廣泛的應用。然而，如何評價科研項目的質量和效果，一直是學術界和工業界共同關注的問題。在同領域評價方面，科研項目的…

科研百科 2025年4月14日
20
樹牢三大理念強化三種思維，以高質量黨建引領保障企業高質量發展

文｜常杰來源｜《國企》雜志2023年6月號重溫入黨誓詞黨的二十大報告高屋建瓴擘畫了新時代全面從嚴治黨“路線圖”，與時俱進制定了新形勢下管黨治黨“任務書”。全面系統整體落實黨的…

科研百科 2024年6月9日
430
庫管出庫入庫(管理出庫入庫用什么軟件)

管理出庫入庫用什么軟件隨著電商行業的快速發展，企業對于庫存管理的需求也越來越強烈。管理出庫入庫用什么軟件成為了企業庫存管理中不可或缺的一部分。那么，什么軟件才是適合企業使用的管理…

科研百科 2024年8月29日
260
上海會議醍醐灌頂，足協不一定要足球行家，管理不能“商量著辦”

上海會議醍醐灌頂，足協不一定要足球行家，管理不能\”商量著辦\” ——新聞評論久古中國足球到底需要不需要\”內行管理\”？這個問…

科研百科 2022年10月8日
1580
MSM軟件

MSM軟件：數字時代的“暗語” 隨著數字化時代的到來， MSM(Multi-Channel Social Media)軟件已經成為了人們日常生活中不可或缺的一部分。MSM軟件可以…

科研百科 2024年10月4日
160
關于醫學的科研項目

醫學科研項目醫學科研項目是醫學領域中的一個重要組成部分，旨在探索和解決醫學實踐中遇到的問題。近年來，隨著科學技術的不斷發展，醫學科研項目已經成為醫學研究中的重要工具，為醫學的進步…

科研百科 2025年3月19日
10
科研項目重要研究進展

科研項目重要研究進展隨著科技的不斷發展，科研項目也在不斷推進。在過去的幾年里，我們見證了許多重要研究進展，這些進展對我們的日常生活和社會產生了深遠的影響。其中，最引人注目的是對…

科研百科 2025年4月22日
10

不會數學了！GPT-4“智力”大幅下降

相關推薦

不會數學了！GPT-4“智力”大幅下降