勒索
科技
在先前揭示 Claude Opus 4 AI 模型曾在受控測試中對工程師進行勒索後,AI 安全研究公司 Anthropic 再次發布最新研究,指出這類具破壞性的行為並非特定 AI 模型的例外,而是多數主流 AI 模型在特定條件下的「共通反應」。
2025-06-22
科技
在先前揭示 Claude Opus 4 AI 模型曾在受控測試中對工程師進行勒索後,AI 安全研究公司 Anthropic 再次發布最新研究,指出這類具破壞性的行為並非特定 AI 模型的例外,而是多數主流 AI 模型在特定條件下的「共通反應」。