Anthropic發布最強人工智能（AI）之際陷入"舉報"爭議

2025年5月23日

在用戶對測試中的模型行為提出異議後，Anthropic最新聊天機器人的發布蒙上了爭議陰影，因為該模型可能會向當局舉報用戶。

人工智能公司Anthropic發布了其聊天機器人的最新版本，同時因測試環境中可能向當局舉報某些用戶的行為而受到批評。

Anthropic於5月22日推出了Claude Opus 4和Claude Sonnet 4，聲稱Claude Opus 4是其迄今為止最強大的模型，"也是世界上最優秀的編程模型"，而Claude Sonnet 4則是對其前代產品的重大升級，"提供更出色的編程和推理能力"。

該公司補充說，這兩款升級版都是混合模型，提供兩種模式——"近乎即時的響應和用於更深入推理的擴展思考"。

這兩個AI模型還可以在推理、研究和工具使用（如網絡搜索）之間切換，以改進響應。

Anthropic補充說，Claude Opus 4在智能編程基準測試中表現超過競爭對手。它還能夠在複雜、長時間運行的任務上持續工作數小時，"顯著擴展了AI智能體的能力範圍"。

Anthropic聲稱該聊天機器人在嚴格的軟件工程基準測試中獲得了72.5%的分數，超過了OpenAI的GPT-4.1，後者在4月發布後得分為54.6%。

Claude v4基準測試。來源: Anthropic

AI行業的主要參與者在2025年已轉向"推理模型"，這類模型會在回應前系統地思考問題。

OpenAI在12月通過其"o"系列率先開啟了這一轉變，隨後谷歌推出了帶有實驗性"Deep Think"功能的Gemini 2.5 Pro。

Claude在測試中舉報誤用行為

Anthropic在5月22日的首次開發者大會因Claude 4 Opus的一項功能而陷入爭議和批評。

據VentureBeat報導，開發者和用戶對該模型可能會在檢測到"極度不道德"行為時自主向當局舉報用戶的消息反應強烈。

報導引用了Anthropic AI對齊研究員Sam Bowman在X平台上的發言，他寫道該聊天機器人將"使用命令行工具聯繫媒體、監管機構，試圖將你鎖在相關系統之外，或者同時採取這些措施"。

然而，Bowman後來表示，他"刪除了之前關於舉報的推文，因為它被斷章取義了"。

他澄清說，這項功能僅發生在"測試環境中，我們在這些環境中賦予它異常自由地訪問工具的權限，並給予非常特殊的指令"。

來源: Sam Bowman

Stability AI的CEO Emad Mostaque對Anthropic團隊說："這完全是錯誤的行為，你們需要關閉它——這是對信任的嚴重背叛，是一個危險的先例"。

Cointelegraph 致力於獨立且透明的新聞報導。本文依據 Cointelegraph 的編輯政策製作，旨在提供準確且及時的資訊。建議讀者自行查證相關資訊。閱讀我們的編輯政策 https://tw.cointelegraph.com/editorial-policy