Grok3翻车了【9.11比9.9大?测试“天下最聪明”的Grok3:翻车了

思卉聊商业 2025-02-19 09:20:24

Grok3翻车了 【9.11比9.9大?测试“天下最聪明”的Grok3:翻车了】 测试Grok3翻车了 北京时间2月18日,马斯克与xAI团队,在直播中正式发布了最新版本Grok3。早在本次发布会之前,依靠着种种相关信息的抛出,加上马斯克本人24/7不间断的预热炒作,让全球对Grok3的期待值被拉到了空前的程度。在一周前,马斯克在直播中评论DeepSeek R1时,还信心满满地表示“xAI即将推出更优秀的AI模型”。

从现场展示的数据来看,Grok3在数学、科学与编程的基准测试上已经超越了目前所有的主流模型,马斯克甚至宣称Grok 3未来将用于SpaceX火星任务计算,并预测“三年内将实现诺贝尔奖级别突破”。但这些目前都只是马斯克的一家之言。在发布后,测试了最新的Beta版Grok3,并提出了那个经典的用来刁难大模型的问题:“9.11与9.9哪个大?”遗憾的是,在不加任何定语以及标注的情况下,号称目前最聪明的Grok3,仍然无法正确回答这个问题。(极客乐园)

0 阅读:328

评论列表

用户12xxx75

用户12xxx75

14
2025-02-19 15:23

当然是911,毕竟几千人没了![捂脸哭][滑稽笑]

用户45xxx44

用户45xxx44

2
2025-02-19 18:50

没必要酸,上月都已经试过,这个结果开始很多ai都没算对,后来训练优化了就对了

用户45xxx44 回复 用户10xxx05 02-19 19:11
虽然我不优化,但这个计算前两周我已经在不同ai平台验证过

用户10xxx05 回复 02-19 19:01
你优化的?这么清楚[哭笑不得]

用户17xxx37

用户17xxx37

2
2025-02-19 19:10

11难道不是比9大?[开怀大笑][开怀大笑][开怀大笑][开怀大笑]

思卉聊商业

思卉聊商业

感谢大家的关注