AI更像人一样思考了,OpenAI昨天发布全新大语言模型o1,能解决编程与数学难题。o1代号草莓,共有两个版本,o1和o1-mini迷你版,按照OpenAI的说法,o1在给出最终答案之前会进行思考,可以解决科学、数学、编程方面的难题。 前代OpenAI模型在SAT美国大学入学考试以及统一律师执照考试表现出色,o1则更进一步,它的表现类似于博士生在具有挑战性的物理、化学和生物学考试,o1在国际数学奥林匹克竞赛的资格考试中击败了OpenAI 今年5月才推出的多模态模型GPT-4o,o1的得分为83,GPT-4o只考了13分。 由于加入了一种被称为“思维链”的提示技术,o1 推理能力的急剧提升。OpenAI表示,o1掌握了识别和纠正错误,它学会了将棘手的解题步骤分解为更简单的步骤,它学会了在当前方法不起作用时尝试不同的方法。 OpenAI在开发o1过程了创建了一个评估人工智能模拟人类能力的五级分类系统,结果显示,o1已接近2级,也就是具有人类解决问题能力水平的“推理者”。 人类智能与人工智能之间的差距变得更小了。 图2:o1在数学竞赛、编程大赛以及博士级别的科学答题中的准确率大幅超越GPT-4o #人工智能##OpenAI##o1##科技#