人工智能公司Anthropic發布了其聊天機器人的最新版本,同時因測試環境中可能向當局舉報某些用戶的行為而受到批評。

Anthropic於5月22日推出了Claude Opus 4和Claude Sonnet 4,聲稱Claude Opus 4是其迄今為止最強大的模型,"也是世界上最優秀的編程模型",而Claude Sonnet 4則是對其前代產品的重大升級,"提供更出色的編程和推理能力"。

該公司補充說,這兩款升級版都是混合模型,提供兩種模式——"近乎即時的響應和用於更深入推理的擴展思考"。

這兩個AI模型還可以在推理、研究和工具使用(如網絡搜索)之間切換,以改進響應。

Anthropic補充說,Claude Opus 4在智能編程基準測試中表現超過競爭對手。它還能夠在複雜、長時間運行的任務上持續工作數小時,"顯著擴展了AI智能體的能力範圍"。

Anthropic聲稱該聊天機器人在嚴格的軟件工程基準測試中獲得了72.5%的分數,超過了OpenAI的GPT-4.1,後者在4月發布後得分為54.6%。

Claude v4基準測試。來源: Anthropic

AI行業的主要參與者在2025年已轉向"推理模型",這類模型會在回應前系統地思考問題。

OpenAI在12月通過其"o"系列率先開啟了這一轉變,隨後谷歌推出了帶有實驗性"Deep Think"功能的Gemini 2.5 Pro。

Claude在測試中舉報誤用行為

Anthropic在5月22日的首次開發者大會因Claude 4 Opus的一項功能而陷入爭議和批評。

據VentureBeat報導,開發者和用戶對該模型可能會在檢測到"極度不道德"行為時自主向當局舉報用戶的消息反應強烈。

報導引用了Anthropic AI對齊研究員Sam Bowman在X平台上的發言,他寫道該聊天機器人將"使用命令行工具聯繫媒體、監管機構,試圖將你鎖在相關系統之外,或者同時採取這些措施"。

然而,Bowman後來表示,他"刪除了之前關於舉報的推文,因為它被斷章取義了"。

他澄清說,這項功能僅發生在"測試環境中,我們在這些環境中賦予它異常自由地訪問工具的權限,並給予非常特殊的指令"。

來源: Sam Bowman

Stability AI的CEO Emad Mostaque對Anthropic團隊說:"這完全是錯誤的行為,你們需要關閉它——這是對信任的嚴重背叛,是一個危險的先例"。

相關推薦: 黑客使用假冒Ledger Live應用竊取助記詞並盜取加密貨幣