最新全球模型榜单:阿里 Qwen2.5-Max 超 DeepSeek V3 2 月 4 日凌晨,三方基准测试平台 Chatbot Arena 公布了最新的大模型盲测榜单,刚刚发布的 Qwen2.5-Max 超越 DeepSeek V3、o1-mini 和 Claude-3.5-Sonnet 等模型,以 1332 分位列全球第七名,也是非推理类的中国大模型冠军。 同时,Qwen2.5-Max 在数学和编程等单项能力上排名第一,在硬提示(Hard prompts)方面排名第二。
最新全球模型榜单:阿里Qwen2.5-Max超DeepSeekV3 2
绮梅谈科技
2025-02-05 14:12:19
0
阅读:0