最新全球模型榜单：阿里Qwen2.5-Max超DeepSeekV3 2

绮梅谈科技 2025-02-05 14:12:19

最新全球模型榜单：阿里 Qwen2.5-Max 超 DeepSeek V3 2 月 4 日凌晨，三方基准测试平台 Chatbot Arena 公布了最新的大模型盲测榜单，刚刚发布的 Qwen2.5-Max 超越 DeepSeek V3、o1-mini 和 Claude-3.5-Sonnet 等模型，以 1332 分位列全球第七名，也是非推理类的中国大模型冠军。同时，Qwen2.5-Max 在数学和编程等单项能力上排名第一，在硬提示（Hard prompts）方面排名第二。

0 阅读：0

绮梅谈科技

感谢大家的关注

作者最新文章

1

OpenWrt 24.10 释出用于路由器等设备的发行版 OpenWrt 释

2

本田与日产合并谈判破裂日产汽车社长内田诚 6 日上午造访东京的本田总部，与本

3

天文学家在系外行星上发现风速高达 9 公里/秒的超音速气流天文学家在一颗系外

4

Google 更新 AI 政策移除了不将 AI 用于武器和监视的承诺 Goog

5

Google 推出 Gemini 2.0 Flash 系列大模型 -Gemin

6

软银与 OpenAI 成立日本 AI 合资企业：SB OpenAI Japan

7

Gemini 2.0 Flash 模型全平台推送 Google 宣布其下 Ge

8

过去四十年海洋表面变暖速度翻了两番 1980 年代后期海洋温度以每十年约 0.

9

最新全球模型榜单：阿里 Qwen2.5-Max 超 DeepSeek V3 2

10

国内航线燃油附加费自 2 月 5 日起上调自 2 月 5 日起，国内航线旅客

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

科技TOP

1

mac你真的神了🫶

2

为什么央视不让苹果露出？在2024年春晚上，有一个细节值得注意，陈奕迅使用的

3

有点想换手机的冲动了

4

小米要破万亿市值了？太猛了，美国关税的情况下，小米都能猛涨[并不简单][加油]

5

多平台宣布上线DeepSeek大模型：腾讯云、阿里云、华为云、360、亚马逊A

6

2025年几乎零差评的几款手机！你认同哪一款？1.Magic72.OPPO

7

扎克伯格宣布2025年投入650亿美元，建立自己的AI大数据库，可是没想到这两天

8

马斯克才是2025最大的冤种！马斯克大选花了2.9亿美元，最后得了个弼马温的职位

9

4款2000档位的手机怎么选？这个价位，一般都是给孩子买的，玩游戏多一些

10

deepseek被用户训练得成精了！

科技最新文章

1

Tiktok的命运早已经注定了，注定要离开美国。马斯克称无意收购TikTok美国

2

DeepSeek引发的蝴蝶效应！东大国2700多位院士，这几天热闹非凡，围绕孙

3

折叠iPhone将登场，屏幕尺寸直逼12英寸据可靠消息透露，苹果正紧锣密鼓地筹备

4

小米真成大公司了，忝列全球市值第100大。以前说小米是世界500强，很多人还

5

国补以后手机销量排名，打醒了多少人！太讽刺了，多少人和我一样，当看到第一名的时候

6

昨天雷军不是发了微博说，标是金子做的嘛，今天我专程替大家来环球港看了看。现在的金

7

【#澳禁止政府系统和设备使用DeepSeek#，澳部长辩称：不是针对中国】据澳

8

小米市值彻底失控估计就连雷军都想不到吧！才过去1个月时间，这哪里是超越和碾压，

9

2025年几乎零差评的几款手机！你认同哪一款？1.Magic72.OPPO

10

国补降价最狠的4款手机！嗯认同哪一款？1.荣耀Magic7，发布价4999，