路透社9月12日消息,由微软支持的OpenAI周四表示,公司推出了名为“Strawberry”(草莓)系列的AI模型,这些模型旨在花更多时间处理查询的答案,以解决复杂问题。 据路透社首次报道,这些新模型能够进行复杂任务的推理,比以前的模型在科学,编程和数学等领域能够解决更具挑战性的问题。 OpenAI内部将该项目称为“草莓”,而周四宣布的模型被命名为o1和o1-mini。公司表示,o1模型将从周四起在ChatGPT及其API中提供。 专注于改进公司模型推理能力的OpenAI研究员布朗(Noam Brown)在社交媒体平台X上确认,这些模型与“草莓”项目相同。 布朗写道:“我很高兴与大家分享我们在OpenAI努力创造真正具有通用推理能力的AI模型的成果。” 在其博客文章中,OpenAI表示,o1模型在国际数学奥林匹克竞赛(International Mathematics Olympiad)资格考试中取得了83%的得分,而其之前的模型GPT-4o的得分为13%。 公司还表示,该模型在竞赛编程问题上的表现有所提升,并在科学问题基准测试中超越了人类博士水平的准确度。 布朗表示,这些模型通过一种称为“思维链”(chain-of-thought)的推理技术取得了这些成绩,该技术涉及将复杂问题分解为更小的逻辑步骤。 研究人员指出,当将这种方法用作提示技术时,AI模型在解决复杂问题时的表现往往会得到改善。 OpenAI现在已将这种能力自动化,使模型能够自主分解问题,而无需用户提示。 OpenAI表示,“我们训练这些模型在回答之前花更多时间思考问题,就像人类一样。通过训练,它们学习精炼思维过程,尝试不同的策略,并识别自己的错误”。 路透社于2023年11月首次报道了OpenAI的推理项目,当时该项目被称为Q*。2024年7月的报道中,项目已被称为草莓。 #秋日生活打卡季# #人工智能#