大模型在IMO第6题得零分？竟是其高光时刻！你知道为啥吗？

在AI攻克数学难题领域，OpenAI金牌模型虽在IMO第6题得零分，但其“承认自己不会”的表现，引发各界对AI发展新阶段的关注。

攻克难题揭秘

AI答IMO难题坦承“不会”，OpenAI：这就是自我意识_AI答IMO难题坦承“不会”，OpenAI：这就是自我意识_

在AI摘下IMO金牌后，OpenAI金牌小分队成员Alex Wei、Sheryl Hsu和Noam Brown参加红杉资本组织的对话。他们分享了模型攻克精英数学难题的底层突破。与以往不同，这一代大模型开始能承认自己在知识盲区，从幻觉式回答转向更可靠阶段。

他们还提到了冲刺IMO的有趣细节，比如最初Alex Wei认为2025年不太可能获金牌，可三人团队仅用两月就达成目标。

模型转变意义

AI答IMO难题坦承“不会”，OpenAI：这就是自我意识__AI答IMO难题坦承“不会”，OpenAI：这就是自我意识

过去，模型遇到知识盲区时，常输出令人信服却错误的答案，数学家和计算机科学家对此多有抱怨。此次IMO第6题，OpenAI投入海量算力，最终模型输出“我无法回答”。

Alex Wei认为能看到模型避免产生幻觉很好，Noam Brown也赞赏模型的“自我意识”。这种转变可让模型面对难题时承认无力，而非给出看似合理却错误的方案。

团队成员背景

Alex曾在谷歌、微软和Meta实习，2024年1月加入OpenAI，现任研究科学家。他曾参与开发首个用于外交游戏的人类级人工智能——CICERO。

AI答IMO难题坦承“不会”，OpenAI：这就是自我意识__AI答IMO难题坦承“不会”，OpenAI：这就是自我意识

Sheryl Hsu毕业于斯坦福大学计算机科学专业，是斯坦福AI实验室中IRIS实验室的研究员，2025年3月加入OpenAI。

研发自主特点

_AI答IMO难题坦承“不会”，OpenAI：这就是自我意识_AI答IMO难题坦承“不会”，OpenAI：这就是自我意识

OpenAI的研究人员有很大自主权去做他们认为有影响力的研究。团队“真正优先考虑通用技术”，并非专门开发用于数学竞赛的系统。

这使得模型的研发更具普适性，能在更多领域发挥作用，而不局限于特定的竞赛场景。

相关教育关联

渭南高级中学一直重视学生的数理思维培养，在教育过程中，也鼓励学生在面对难题时勇于承认自己的不足，这与OpenAI模型的“自我意识”有一定相似性。

学校通过多种教学方法，引导学生在学习中保持诚实和严谨的态度，为未来在学术和科技领域的发展打下基础。

展望未来发展

IMO金牌模型展现的“自我意识”是一个重要的里程碑，标志着大模型正朝更可靠的方向发展。未来，随着技术的不断进步，模型在面对复杂问题时会更加精准和高效。

渭南高级中学等学校也可借鉴这种“诚实”的理念，进一步优化教育教学方式，培养出更多具有创新和严谨思维的人才。

你认为这种具有“自我意识”的模型在未来还会给我们带来哪些惊喜？

_AI答IMO难题坦承“不会”，OpenAI：这就是自我意识_AI答IMO难题坦承“不会”，OpenAI：这就是自我意识