OpenAI推出GPT-4 多項考試超越90%的人類

OpenAI推出GPT-4 多項考試超越90%的人類

一支手機屏幕上顯示的OpenAI和ChatGPT圖標。（Lionel Bonaventure/AFP via Getty Images）

更新 2023-03-15 1:34 PM 人氣 943

標籤: OpenAI, 人工智能, GPT-4, SAT, 人類

【大紀元2023年03月15日訊】（大紀元記者高杉編譯報導）OpenAI公司週二（3月14日）發布了其大型語言模型的最新版本：GPT-4。並表示，在許多專業測試中，該人工智能已經表現出「人類水平的能力」。

OpenAI（開放人工智能）公司指出，ChatGPT-4比以前的版本「更巨大」。這意味著，它已經在更龐大的數據上進行了訓練，而且其模型文件中有更多的參數，這使得它的運行成本也更高。

OpenAI（開放人工智能）是美國一個人工智能研究實驗室，由營利組織OpenAI LP與母公司非營利組織OpenAI Inc所組成，目的是促進和發展人工智能。

目前，人工智能領域的許多研究人員認為，該領域的許多最新進展，都來自於在數以千計的超級計算機上運行的、越來越大的模型，其訓練過程可能耗資數千萬美元。此類以「擴大規模」來獲得更好效果的方法中，GPT-4就是一個最好的例子。

OpenAI公司表示，它使用了微軟Azure來訓練模型。微軟已經向這家初創公司投資了數十億美元。

與以往不同的是，OpenAI此次沒有同時公布具體的模型規模，或用於訓練模型，使其可以重新創建模型的硬件的細節，理由是所處的「競爭環境」。

OpenAI的GPT大型語言模型為許多人工智能樣板產品提供了支持。在過去六個月裡，人工智能的這些樣板產品，包括必應（Bing）的人工智能聊天和ChatGPT等等，一直讓科技行業人士驚歎不已。

最新的版本是新技術的預覽，這些技術的進步可能在未來幾週開始滲透到聊天機器人等消費產品中。微軟週二表示，必應的人工智能聊天機器人使用的就是GPT-4。

OpenAI表示，使用新的模型後，將更少出現錯誤答案，更少地偏離話題，以及更少談論禁忌話題。與此同時，甚至在許多標準化專業測試中，它的表現要比大部分人類更好。

OpenAI聲稱，在模擬的律師考試中，GPT-4的表現超過了90%的人類的成績；在SAT閱讀考試中排名93%；在SAT數學考試中排名89%。

然而，OpenAI同時指出，新的軟件仍不完美，在許多情況下，它的能力仍然不如人類。該公司說，它在「幻想」或「編造東西」方面，仍存在很大的問題，而且在「誠實性」方面也並不可靠。它仍然容易在犯錯誤的時候，堅持認為自己是正確的。

該公司在一篇博文中說：「GPT-4仍有許多已知的局限性，我們正在努力解決，如存在社會偏見、幻想不足和存在對抗性回覆等。」

OpenAI在一篇博文中寫道：「在閒談時，GPT-3.5和GPT-4之間的區別可能不是很容易被察覺。但當任務的複雜性達到足夠的閾值時，區別就顯現出來了：GPT-4比GPT-3.5更可靠、更有創造力，能夠處理更細緻的指令。」

新模型將提供給ChatGPT的付費用戶，也將作為API的一部分，允許程序員將人工智能整合到他們的應用程序中。OpenAI將對約750個單詞的指令信息收取約3美分，對約750個單詞的響應信息收取6美分。◇

責任編輯：葉紫微#

相關新聞

美國學校禁用人工智能ChatGPT 防學生作弊

美國學校禁用人工智能ChatGPT 防學生作弊人氣 2061

蓋茨：像ChatGPT這樣的人工智能是重大創新

蓋茨：像ChatGPT這樣的人工智能是重大創新人氣 990

加情報局：中共瞄準加拿大人工智能技術

加情報局：中共瞄準加拿大人工智能技術人氣 353

調查：憂監管不足多數澳人不信任人工智能

調查：憂監管不足多數澳人不信任人工智能

如果您有新聞線索或資料給大紀元，請進入安全投稿爆料平台。

評論