DeepSeek带给外国人的震撼远没结束。大模型再次传来炸裂消息,这次是阿里做的

天天谈科技 2025-03-06 17:35:13

DeepSeek带给外国人的震撼远没结束。大模型再次传来炸裂消息,这次是阿里做的!

前脚DeepSeek R1开源,还没等全球开发者消化完,后脚阿里千问就直接扔出QwQ-32B!今天凌晨,阿里深夜开源了他们全新的推理模型QwQ-32B,看到他们发出来的性能比对图,有种把整个AI社区炸翻的节奏!

QwQ-32B到底有多猛?在几乎所有数据集里,QwQ-32B 都已经能跟满血版DeepSeek R1(671B)表现相当。尤其是在数学推理、代码能力等关键领域,直接拉开o1-mini跟Llama-3.2-3B一个身位。

更夸张的是,DeepSeek-R1是6700亿参数的巨无霸,而QwQ只有320亿参数,但在实际测试中,QwQ竟然能用更轻量的规模达到相当的推理能力。更别提,R1想跑起来,需要1400G显存,而QwQ只要4张4090就能轻松部署,直接把AI门槛砸到了地板上!

更可怕的是,这还只是个开始。 QwQ-32B这次采用了强化学习调优,这一点已经被斯坦福教授重点研究,发现阿里的Qwen团队优化出的模型,竟然可以自己检查自己的答案,这在当前的开源模型中是独一无二的。DeepSeek和阿里的开源策略,正在推动AI能力全面进化。

海外开发者已经炸了,一位硅谷AI研究员甚至表示:“Qwen 刚刚发布了 QwQ-32B,中国有朝一日将为人类开源AGI。”

从DeepSeek到阿里,从R1到QwQ-32B,中国AI开源的步伐越来越快,影响力也越来越大。 Qwen2.5多次登顶Chatbot Arena榜单,、成为最受欢迎的开源大模型之一。前几天,阿里万相大模型开源仅6天,也把DeepSeek-R1挤下王座,稳坐Hugging Face双料冠军。

曾经,全球AI市场是ChatGPT说了算,而现在,DeepSeek和阿里的通义千问正用开源打破封闭壁垒,让所有人都能参与到AI创新中。未来,AI不再只是少数巨头的游戏,而是全球开发者共同创造的新时代!

0 阅读:39
天天谈科技

天天谈科技

欢迎大家点赞关注