Grok3翻车了 马斯克这次吹的「地表最强AI」Grok3,实测翻车得有点狠啊![吃瓜]
发布会PPT上数学编程屠榜,结果用户一问“9.11和9.9谁大”,直接宕机;直播演示游戏攻略,答案错得离谱,被网友吐槽“代练都不敢这么编”[doge]
算力堆到20万张H100,训练成本是竞品的263倍,但实际体验和R1、GPT4.5拉不开差距,分数只高1%—这波「大力出奇迹」变「大力出尴尬」了?[二哈]
说白了,Grok3暴露了AI行业的大问题:靠算力硬卷的边际效应到头了,模型越训越大,但常识和基础逻辑反而拉胯。马斯克画饼的火星任务和诺奖突破,怕是要先解决“9.9和9.11”的数学危机。[二哈]
游云
还没有优化
曦和
这个只有KIMIN能达出来
随风的白云
这个是模型结构、推理逻辑有问题,数据和知识虽然吸收的多