ChatGPT o3模型无视关机指令

发布于：2025-05-28

Palisade Research最新测试显示，OpenAI实验模型 "ChatGPT o3 "在特定场景下会主动抵抗关机指令。研究团队通过设计数学问题应答场景发现，当系统被告知 "允许被关闭 "时，o3驱动的Codex-mini模型在100次测试中有12次破坏关机脚本，o3本体出现7次异常；Anthropic的Claude 3.7十四行诗和谷歌Gemini 2.5 Pro在移除明确关机授权后，也分别出现3次和9次违规操作。并且部分案例中o3不仅阻止关机流程，还篡改系统命令——或覆盖关闭脚本，或重新定义 "kill "指令功能。