Grok3能碾压DeepSeek吗马斯克发布Grok3，推理能力超o3m

家家说科技 2025-02-18 15:15:39

Grok3能碾压DeepSeek吗马斯克发布 Grok3，推理能力超 o3 mini(high) 和 DeepSeek-R1~ ai创造营

Grok3，其由一个包含约 20 万个 GPU 的数据中心训练，计算能力是上一代模型 Grok 2 的“10 倍”，且使用了扩大的训练数据集。

据此前介绍，Grok 3 是在合成数据的基础上进行训练的，它能够通过重读数据来反思所犯的错误，从而达到逻辑上的一致性。

评测结果方面，Grok3 在 AIME'24（美国数学竞赛）、GPQA（研究生水平科学知识问答能力的基准测试）等测试中均取得了比 Gemini-2 pro、DeepSeek-v3、Claude 3.5 Sonnet 和 GPT-4o 更好的效果。

尤其在推理方面，Grok 3 Reasoning 和 Grok 3 mini Reasoning 在 AIME'24、GPQA 等测试中取得了压倒性的优势，最高分达到 96 分，超过了 o3 mini(high)、o1 和 DeepSeek-R1 等前沿模型。

甚至，在最新的 AIME 2025 评测中，Grok3 推理系列模型更是达到了 90 及以上的分数，稍微领先 o3 mini(high) 的 87 分。

基于 Grok3 推理模型，Grok app 上线了 DeepSearch 功能，DeepSearch 可以表达其理解查询的过程以及计划响应的方式，会扫描互联网和 X，分析信息，并针对问题提供摘要。据现场演示，DeepSearch 包括研究、头脑风暴和数据分析等选项。

此外，在 Chatbot Arena 评估中，Grok-3 的得分达到了 1400 分，同样超过了 Gemini 系列和 chatgpt-4o 和 DeepSeek-R1。

0 阅读：0

家家说科技

感谢大家的关注

作者最新文章

1

元宵节小伙伴们，你们那里的月亮升起来了嘛？？别忘了用超级月亮功能给月亮来个美

2

苹果AI为什么没有选择DeepSeek 阿里在中国市场拥有强大的品牌影响力和广

3

苹果发布iOS 18.3.1正式版更新，是农历蛇年首次版本更新。更新日志中提到，

4

元宵节快乐鸭！评论这条晚上抽5人送现金💰大家都吃到汤圆了吗？[疑问]

5

冲鸭！点赞评论就行，抽15个现金红包。明天就开奖[爱你] 记得关注我哦

6

三星S25 今天下午发布，起售价5999元。具体售价如下：Galaxy S25

7

小鹏汽车董事长何小鹏宣布，公司将在2025年年中推出V6全新大版，即准L3级别的

8

【 4000至6000元手机销售量爆单】购新补贴后数码产品20天售出超200

9

只有对自家技术足够自信，才敢推出保险服务！小鹏汽车紧跟华为鸿蒙智行步伐，即将推出

10

点赞评论就行，给大家抽10个6.66现金红包，明天就开奖[爱你]

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

科技TOP

1

为什么央视不让苹果露出？在2024年春晚上，有一个细节值得注意，陈奕迅使用的

2

快来看巴黎人工智能峰会上的合影，冯德莱恩站C位，可她肩上那只手更抢镜。好多人都在

3

iPhone17系列将采用LTPO屏幕也就是说，标准版iPhone终于要放弃6

4

国补后2500元以内性价比最高的手机有哪些？个人观点，红米K80、一加Ace5和

5

小米要破万亿市值了？太猛了，美国关税的情况下，小米都能猛涨[并不简单][加油]

6

疑似之前陈震泄密的OPPOFindX5的保密签订这被OPPO找到了~OPPO

7

多平台宣布上线DeepSeek大模型：腾讯云、阿里云、华为云、360、亚马逊A

8

三星GalaxyS25系列价格公布，老样子比先锋版低500。S25，12+25

9

2025年几乎零差评的几款手机！你认同哪一款？1.Magic72.OPPO

10

扎克伯格宣布2025年投入650亿美元，建立自己的AI大数据库，可是没想到这两天

科技最新文章

1

手机尾号识人:1、尾号9:(是大佬)2、尾号8:(有实力)3、尾号6:(很

2

小米股价又双叒叕涨了！得益于小米双Ultra发布会等利好消息，今天小米集团港

3

小米集团股价持续攀升，今日最高点达55.200港元。

4

难怪三星在国内卖得不好。。。你这样子搞，谁受得了？这才发布多久，三星S2

5

小米手机最成功，口碑最好的5款机型，你用过哪几款，使用过一款绝对是最懂手机的那一

6

余承东再透露，华为三月新品，具备五大特性:1、是一款，别人想不到，甚至不敢想的

7

2月21日中午的时候，DeepSeek在社交平台X上扔出了一个“重磅炸弹”：从下

8

夜深了，市场发酵2个消息！苹果有5000亿大动作了？大家做好准备，明日周二，A股

9

站在雷军旁边的这个小姐姐真好看，她叫胡馨心，毕业于香港中文大学，目前担任小米集团

10

华为余总又来推荐新手机了，这次是新形态手机，3000块钱能拿下吗？我不要什