OpenAIo1具有“博士级”推理、数学和编码技能的新AI模型

9月12日，ChatGPT开发商OpenAI宣布推出一系列新的人工智能推理模型，以解决难题。

人工智能推理模型代号为草莓，现在正式命名为OpenAI o1。

OpenAI训练了这些模型，让它们在响应之前花更多的时间思考问题，就像一个人一样。

根据OpenAI的说法，这些模型可以通过复杂的任务进行推理，并解决比以前的科学、编码和数学模型更难的问题。

OpenAI表示，这些模型通过训练学会完善自己的思维过程，尝试不同的策略，并识别自己的错误。

在测试中，新模型在具有挑战性的基准物理、化学和生物学任务上的表现与博士生相似。该模型在数学和编码方面也表现出色。

在国际数学奥林匹克竞赛（IMO）的资格考试中，目前可用的GPT-4o仅正确解决了13%的问题，而OpenAI o1模型为83%。

GPT-4o作为早期的模型，它需要许多条件使触发ChatGPT的功能，比如浏览网页以获取信息以及上传文件和图像。

对于许多常见情况，GPT-4o很快就会学习到相应的数据知识。然而，对于复杂的推理任务却有一定的困难，因此，对于OpenAI o1来说，这是一个重大的进步，代表了人工智能能力的新水平。

鉴于此，OpenAI将计数器重置为1，并将此系列命名为OpenAI o1。

作为开发这些新模型的一部分，OpenAI还开发了一种新的安全培训方法，利用他们的推理能力来确保他们遵守安全和对齐指南。

通过对越狱模型进行用户测试来衡量安全性。在最难越狱的测试之一中，GPT-4o得分为22（0到100分），而o1预览版得分为84。

OpenAI表示，这些增强的推理能力对于解决科学、编码、数学和类似领域的复杂问题非常有用。

例如，o1可用于医疗保健研究人员注释细胞测序数据，物理学家生成量子光学所需的复杂数学公式，以及所有领域的开发人员构建和执行多步骤工作流程。

o1系列擅长准确生成和调试复杂代码。

为了向开发人员提供更高效的解决方案，OpenAI还发布了OpenAI o1-mini，这是一种更快、更便宜的推理模型，在编码方面特别有效。

作为一个较小的模型，o1 mini比o1预览版收费便宜80%，使其成为需要推理但不需要广泛知识的应用程序的强大、经济高效的模型。

从今天开始，ChatGPT Plus用户可以在ChatGPT中访问o1模型。

模型选择器允许您手动选择o1预览和o1-mini。在发布时，o1预览的每周速率限制为30条消息，o1 mini为50条消息。

OpenAI还致力于提高这些速率，并使ChatGPT能够自动为给定的提示选择正确的模型。

有资格使用API第5层的开发人员今天可以开始在API中使用这两个模型进行原型设计，速率限制为20 RPM。

这些模型的API目前不包括函数调用、流、对系统消息的支持和其他功能。

OpenAI还计划为所有ChatGPT Free用户提供o1 mini访问权限。

古典风资讯网