OpenAI“小妖精问题”浮出水面《连线》杂志报道披露 OpenAI 编码模型指令禁止提及小妖精、小怪物等生物随后 OpenAI 在网站上作出解释称模型提及这些生物是训练中养成的“奇怪习惯”。问题根源模型训练奖励古怪隐喻从 GPT - 5.1 模型起OpenAI 就发现模型会使用提及小妖精等生物的隐喻特别是启用“书呆子”个性选项时。随着后续模型发布问题愈发严重原因是强化训练奖励了“书呆子”个性中的古怪隐喻而新模型基于此训练。解决难题下达指令与撤销方法尽管 3 月停用“书呆子”个性后对小妖精和小怪物的提及有所减少但在 Codex 编码工具的 GPT - 5.5 模型中仍未完全消失。为此OpenAI 给 Codex 下达具体指令禁止提及这些神话生物同时还分享了撤销这些指令的方法以满足用户让人工智能代码带有小妖精元素的需求。编辑观点OpenAI 公开“小妖精问题”显示其在模型训练中面临挑战。虽采取措施解决但仍需不断优化训练机制以提升模型质量和稳定性。