9月12日,ChatGPT开发商OpenAI宣布推出一系列新的人工智能推理模型,以解决难题。
人工智能推理模型代号为草莓,现在正式命名为OpenAI o1。
OpenAI训练了这些模型,让它们在响应之前花更多的时间思考问题,就像一个人一样。
根据OpenAI的说法,这些模型可以通过复杂的任务进行推理,并解决比以前的科学、编码和数学模型更难的问题。
OpenAI表示,这些模型通过训练学会完善自己的思维过程,尝试不同的策略,并识别自己的错误。
在测试中,新模型在具有挑战性的基准物理、化学和生物学任务上的表现与博士生相似。该模型在数学和编码方面也表现出色。
在国际数学奥林匹克竞赛(IMO)的资格考试中,目前可用的GPT-4o仅正确解决了13%的问题,而OpenAI o1模型为83%。
GPT-4o作为早期的模型,它需要许多条件使触发ChatGPT的功能,比如浏览网页以获取信息以及上传文件和图像。
对于许多常见情况,GPT-4o很快就会学习到相应的数据知识。然而,对于复杂的推理任务却有一定的困难,因此,对于OpenAI o1来说,这是一个重大的进步,代表了人工智能能力的新水平。
鉴于此,OpenAI将计数器重置为1,并将此系列命名为OpenAI o1。
作为开发这些新模型的一部分,OpenAI还开发了一种新的安全培训方法,利用他们的推理能力来确保他们遵守安全和对齐指南。
通过对越狱模型进行用户测试来衡量安全性。在最难越狱的测试之一中,GPT-4o得分为22(0到100分),而o1预览版得分为84。
OpenAI表示,这些增强的推理能力对于解决科学、编码、数学和类似领域的复杂问题非常有用。
例如,o1可用于医疗保健研究人员注释细胞测序数据,物理学家生成量子光学所需的复杂数学公式,以及所有领域的开发人员构建和执行多步骤工作流程。
o1系列擅长准确生成和调试复杂代码。
为了向开发人员提供更高效的解决方案,OpenAI还发布了OpenAI o1-mini,这是一种更快、更便宜的推理模型,在编码方面特别有效。
作为一个较小的模型,o1 mini比o1预览版收费便宜80%,使其成为需要推理但不需要广泛知识的应用程序的强大、经济高效的模型。
从今天开始,ChatGPT Plus用户可以在ChatGPT中访问o1模型。
模型选择器允许您手动选择o1预览和o1-mini。在发布时,o1预览的每周速率限制为30条消息,o1 mini为50条消息。
OpenAI还致力于提高这些速率,并使ChatGPT能够自动为给定的提示选择正确的模型。
有资格使用API第5层的开发人员今天可以开始在API中使用这两个模型进行原型设计,速率限制为20 RPM。
这些模型的API目前不包括函数调用、流、对系统消息的支持和其他功能。
OpenAI还计划为所有ChatGPT Free用户提供o1 mini访问权限。