Claude 4系列怎么樣? 七小時連續(xù)編程創(chuàng)紀錄?

Claude 4系列怎么樣? 七小時連續(xù)編程創(chuàng)紀錄?

昨日,人工智能企業(yè)Anthropic正式發(fā)布Claude 4系列大模型,包含Opus 4與Sonnet 4雙版本。那么Claude 4怎么樣呢?下面就為大家詳細介紹下。

據(jù)了解,Claude 4系列中Opus 4以連續(xù)7小時自主編程能力打破行業(yè)紀錄,成為全球首個通過Rakuten高強度開源重構測試的AI模型。兩款模型即日起通過Anthropic API、亞馬遜Bedrock及谷歌Vertex AI開放商用,定價維持Opus系列百萬tokens 15/75美元、Sonnet系列3/15美元標準。

作為性能旗艦,Opus 4在SWE-bench真實工程任務測試中準確率達72.5%,TerminalBench多步驟終端代碼生成任務中實現(xiàn)43.2%準確率。該模型采用動態(tài)內存管理技術,可創(chuàng)建本地文件存儲關鍵信息——實測運行《寶可夢紅》時自動生成導航指南,使AI在長期任務中保持連貫性。GitHub已宣布采用Sonnet 4作為Copilot新版編碼代理底層模型,其代碼導航錯誤率從20%降至接近零,成為軟件開發(fā)自動化的重要推手。

技術革新方面,Claude 4引入工具并行執(zhí)行機制,允許AI在推理與網(wǎng)絡搜索、API調用間自由切換,任務效率提升30%。開發(fā)者現(xiàn)可通過VS Code、JetBrains插件實現(xiàn)代碼編輯內聯(lián)顯示,借助GitHub Actions執(zhí)行后臺任務,打造無縫編程體驗。內存系統(tǒng)升級使模型”走捷徑”行為減少65%,配合思維摘要功能壓縮冗長推理鏈,保障復雜任務穩(wěn)定性。

行業(yè)反響顯示,Cursor評價Opus 4實現(xiàn)代碼庫理解能力質的飛躍,Replit驗證其跨文件修改精度提升40%。Block開發(fā)者證實該模型在保持性能前提下提升代碼質量,Cognition實驗室則解決其他模型無法處理的53項關鍵操作遺漏。隨著Claude Code SDK全面開放,這場AI生產力革命正從代碼領域向科學研究、多模態(tài)應用加速滲透。

原創(chuàng)文章,作者:AI,如若轉載,請注明出處:http://m.2079x.cn/article/720562.html

AI的頭像AI認證作者

相關推薦

發(fā)表回復

登錄后才能評論