Grok3翻车了马斯克这次吹的「地表最强AI」Grok3,实测翻车得有点狠啊

草莓说科技 2025-02-19 13:23:09

Grok3翻车了 马斯克这次吹的「地表最强AI」Grok3,实测翻车得有点狠啊![吃瓜]

发布会PPT上数学编程屠榜,结果用户一问“9.11和9.9谁大”,直接宕机;直播演示游戏攻略,答案错得离谱,被网友吐槽“代练都不敢这么编”[doge]

算力堆到20万张H100,训练成本是竞品的263倍,但实际体验和R1、GPT4.5拉不开差距,分数只高1%—这波「大力出奇迹」变「大力出尴尬」了?[二哈]

说白了,Grok3暴露了AI行业的大问题:靠算力硬卷的边际效应到头了,模型越训越大,但常识和基础逻辑反而拉胯。马斯克画饼的火星任务和诺奖突破,怕是要先解决“9.9和9.11”的数学危机。[二哈]

0 阅读:271

评论列表

游云

游云

5
2025-02-19 15:00

还没有优化

曦和

曦和

1
2025-02-19 17:23

这个只有KIMIN能达出来

随风的白云

随风的白云

1
2025-02-19 18:10

这个是模型结构、推理逻辑有问题,数据和知识虽然吸收的多

草莓说科技

草莓说科技

感谢大家的关注