草莓,来得比想象中的要更快!
这两天网上一直在传OpenAI将会在两周内发布全新的草莓模型,号称史上最强。
结果消息刚传出来,OpenAI就在北京时间的半夜正式发布了全新的o1模型系列。
川哥记得去年下半年就有人一直在传OpenAI在秘密训练新的大模型。
而OpenAI创始人奥特曼也在公众面前多次明示暗示他们在训练中见到了不可思议的事儿。
而如今,这颗被寄予厚望的"草莓"也终于揭开了神秘面纱。
说实话,川哥第一眼看到o1的介绍时,确实有被震撼到。
这哪里是一颗草莓,这分明就是一颗原子弹啊!
它不仅在各种高难度基准测试中碾压GPT-4,甚至在某些领域已经超越了人类专家。
更重要的是,o1的出现,很可能给整个AI领域带来一场史诗级的变革。
o1到底有多强?
在国际数学奥林匹克(IMO)资格考试中,强如GPT-4也只能正确解答13%的问题,而o1却能解决83%!
这意味着,o1已经有能力获得数学奥赛金牌了。
要知道,数学,从来就是衡量智能的金标准。
而如今,AI终于在这一领域,与人类天才近乎并肩了。
更令人震撼的是,在GPQA Diamond这种博士级别的基准测试中,o1更是首次超越了拥有博士学位的人类专家。
这个基准测试涵盖了化学、物理和生物学等领域的高深知识,o1能在这里胜出,足以证明它已经具备了相当强大的科学推理能力。
在编程方面,o1同样表现惊艳。
在模拟的Codeforces编程竞赛中,o1的Elo评分高达1807,超过了93%的人类竞争对手。
这意味着,o1已经可以成为一名出色的软件工程师了。
但o1最让人惊叹的,还是它的思考能力。
就像人类在回答难题前要深思熟虑一样,o1会在给出答案前先进行大量的内部推理。
通过强化学习,它能不断完善自己的思维过程,尝试各种策略,甚至意识到自己的错误并加以修正。
这种"深思熟虑"的能力,让o1可以解决之前AI无法应对的复杂问题。
同时也验证了语言模型能通过强化学习实现跃升。
就像AlphaGo当年一样,给AI模型越多算力,它就输出越多智能。
咱们不妨大胆想一想,如果这一过程无限延续下去,智能爆炸还会远吗?
说实话,看到这里,川哥不禁想起了电影《她》中的AI助手萨曼莎。
o1的思考模式,是不是已经越来越接近真正的智能了?
当然,OpenAI也意识到了o1潜在的风险。
为了确保安全,他们采取了一系列措施,包括将安全规则整合到o1的思维链中,以及隐藏原始思维链等。
但这些措施是否足够?在AI越来越强大的今天,我们真的能完全掌控它吗?
不过,话说回来,o1的出现无疑是一个重大突破。
虽然它还不能称为AGI,但它的出现无疑预示着,那个曾经只存在于科幻中的未来,正以前所未有的速度迫近我们。
想到这,川哥突然脑洞大开,o1里的o或许也有一层"origin"的深意,起源、开端,1则暗示了一个全新时代的开启。
AGI时代,或许真的很近了。
OpenAI目前针对ChatGPT付费用户开放了o1的两个版本,o1预览版和o1 mini版。
o1预览版每周只能使用30次,o1-mini版每周可以使用50次。
从这儿也不难看出来,o1需要调用的算力有多强了,哪怕是去年的GPT 4也是以小时为单位的,到o1这直接按周来计算了。
而这还都不算是完全形态的o1模型。
等到o1的完全体开放的时候,难以想象会是一个什么局面。