Grok3翻车了 【9.11比9.9大?测试“天下最聪明”的Grok3:翻车了】 测试Grok3翻车了 北京时间2月18日,马斯克与xAI团队,在直播中正式发布了最新版本Grok3。早在本次发布会之前,依靠着种种相关信息的抛出,加上马斯克本人24/7不间断的预热炒作,让全球对Grok3的期待值被拉到了空前的程度。在一周前,马斯克在直播中评论DeepSeek R1时,还信心满满地表示“xAI即将推出更优秀的AI模型”。
从现场展示的数据来看,Grok3在数学、科学与编程的基准测试上已经超越了目前所有的主流模型,马斯克甚至宣称Grok 3未来将用于SpaceX火星任务计算,并预测“三年内将实现诺贝尔奖级别突破”。但这些目前都只是马斯克的一家之言。在发布后,测试了最新的Beta版Grok3,并提出了那个经典的用来刁难大模型的问题:“9.11与9.9哪个大?”遗憾的是,在不加任何定语以及标注的情况下,号称目前最聪明的Grok3,仍然无法正确回答这个问题。(极客乐园)
用户12xxx75
当然是911,毕竟几千人没了![捂脸哭][滑稽笑]
用户45xxx44
没必要酸,上月都已经试过,这个结果开始很多ai都没算对,后来训练优化了就对了
用户45xxx44 回复 用户10xxx05 02-19 19:11
虽然我不优化,但这个计算前两周我已经在不同ai平台验证过
用户10xxx05 回复 02-19 19:01
你优化的?这么清楚[哭笑不得]
用户17xxx37
11难道不是比9大?[开怀大笑][开怀大笑][开怀大笑][开怀大笑]