大模型競爭愈發激烈：Anthropic推出混合推理模型

來源：發布時間：2025-03-13

2月25日，由亞馬遜支持的AI初創公司Anthropic推出較早混合推理模型Claude 3.7 Sonnet。它可以產生近乎即時的反應和對用戶可見、可擴展的逐步思考。API用戶還可以控制模型思考時間。

Anthropic表示，正如人類使用一個大腦進行快速反應和深度思考一樣，推理應該是前沿模型的綜合能力，而不是完全獨有的模型。這種統一方法可以為用戶創造無縫體驗。Claude 3.7 Sonnet既是一個普通的大模型，也是一個推理模型，用戶可以選擇何時讓模型在標準模式下回答，何時讓模型在回答前思考更長時間。Anthropic聯合創始人兼首席科學官賈里德·卡普蘭（Jared Kaplan）表示：“我們想要一個連貫的人工智能，它可以幫助我們做任何事情。”

在標準模式下，Claude 3.7 Sonnet是Claude 3.5 Sonnet的升級版。在擴展思維模式下，Claude 3.7 Sonnet在回答問題前會自我反思，數學、物理、指令遵循、編程等任務上的表現得到提高。

在標準模型和擴展思維模式下，Claude 3.7 Sonnet每百萬輸入token為3美元，每百萬輸出token為15美元，其中包括思考的token。當通過API使用Claude 3.7 Sonnet時，用戶還可以控制思考的預算，在速度和成本上換取質量，例如用戶可以要求Claude思考不超過多少個token。

Anthropic表示，擴展思維模式使模型在數學、物理、指令遵循、編程等任務方面獲得提升。

Anthropic產品負責人、Instagram的聯合創始人邁克·克里格（Mike Krieger）表示，這種混合方式可以簡化聊天機器人流程，用戶可以使用多種功能，而不需要考慮哪個是比較好的選擇。

Anthropic在開發推理模型時降低了對數學和計算機科學競賽問題的優化程度，而是將優化的重點轉移到現實世界任務上，這些任務更好地反映企業實際如何使用大模型。

Claude 3.7 Sonnet在編程和前端網絡開發方面優化改進，并引入一個用于智能編程的命令行工具Claude Code。Claude Code可以搜索和讀取代碼、編輯文件、編寫和運行測試、提交和推送代碼到GitHub，并使用命令行工具，開發者可以直接將大量工程任務委托給Claude Code。

在早期測試中，Claude Code一次性完成了通常需要45分鐘以上手動工作的任務，減少了開發時間和開銷。Anthropic表示，在接下來的幾周里計劃根據開發者的使用情況繼續改進，增強工具調用的可靠性、增加對長時間運行命令的支持等。

“我們使用Claude Code的目標是更好地理解開發者如何使用Claude編程，為未來的模型改進提供信息。”Anthropic表示，Claude 3.7 Sonnet是該企業迄今比較好的編程模型，隨著對用戶工作和開源項目的深入了解，它可以在GitHub項目中修復bug（漏洞）、開發功能和構建文檔。

2月以來，大模型競爭態勢愈發激烈。2月18日，特斯拉創始人埃隆·馬斯克旗下xAI推出目前大模型Grok 3。Grok 3和輕量化的Grok 3 mini在多個性能上超過或媲美Gemini、DeepSeek和GPT-4o等對手。Grok 3在xAI位于孟菲斯的Colossus超算中心進行訓練。xAI透露，這一超算中心的算力已經翻倍，擁有的英偉達GPU數量達20萬顆。

2月13日，OpenAI首席執行官山姆·奧特曼（Sam Altman）在社交媒體上表示，下一個將發布的模型是OpenAI末尾一個非思維鏈模型GPT-4.5，也被稱為Orion（獵戶座）模型。在那之后，OpenAI的比較高目標是創建可以使用所有工具的系統來統一o系列模型和GPT系列模型，它能夠知道什么時候應該長時間思考，并且通常適用于普遍任務。OpenAI將發布GPT-5，GPT-5將成為一個集成o3模型等OpenAI諸多技術的系統。“我們希望AI ‘只為你工作’，我們意識到我們的模式和產品供應變得多么復雜。我們和你一樣討厭模型選擇器，希望回歸神奇的統一智能。”

轉載自澎湃新聞

標簽： Anthropic 混合推理模型 Claude 3.7 Sonnet

上一篇 沒有了

下一篇 Agent大戰打響！OpenAI推出工具鏈簡化智能體開發