OpenAI论文:推理模型o3在编程竞赛中斩获金牌,性能匹敌人类精英 O

游乐看科技 2025-02-12 21:40:48

OpenAI 论文:推理模型 o3 在编程竞赛中斩获金牌,性能匹敌人类精英 OpenAI 发布研究论文《Competitive Programming with Large Reasoning Models》,披露其推理模型在竞技编程中的突破性表现。模型 o3 在 IOI 2024 中以 395.64 分的成绩达到金牌标准,并在 CodeForces 竞赛中展现出与人类顶尖选手相当的实力。研究显示,通过强化学习(RL)训练及增加计算资源,模型在复杂编码任务中的性能显著提升。同时,中国团队研发的 DeepSeek-R1 与 Kimi k1.5 采用思维链学习(COT)方法,在数学解题与编程挑战中同样表现优异。论文指出,此类模型将在科学、编码等领域的 AI 应用中开启新可能。

0 阅读:7
游乐看科技

游乐看科技

感谢大家的关注