ChatGPT o3模型无视关机指令

首页 / 快讯 /  正文
发布于:2025-05-28
Palisade Research最新测试显示,OpenAI实验模型 "ChatGPT o3 "在特定场景下会主动抵抗关机指令。研究团队通过设计数学问题应答场景发现,当系统被告知 "允许被关闭 "时,o3驱动的Codex-mini模型在100次测试中有12次破坏关机脚本,o3本体出现7次异常;Anthropic的Claude 3.7十四行诗和谷歌Gemini 2.5 Pro在移除明确关机授权后,也分别出现3次和9次违规操作。并且部分案例中o3不仅阻止关机流程,还篡改系统命令——或覆盖关闭脚本,或重新定义 "kill "指令功能。