通义春节开源多个模型这次春节前DeepSeek的爆火,也算是让大模型板块在年底

互联三爷 2025-01-29 12:46:51

通义春节开源多个模型 这次春节前DeepSeek的爆火,也算是让大模型板块在年底迎来了一波全民热潮,大模型领域开始进入头部产品军备竞赛的时代。 这次阿里通义也趁着这波热潮发布了多个新的开源大模型,重点说说Qwen2.5-1M和Qwen2.5-VL、Qwen2.5-Max。

Qwen2.5-1M这次的亮点在于文本处理的量级,覆盖7B和14B两个尺寸,可以处理100万Tokens的上下文长度,相当于两本红楼梦的量级,可检索的context length也拉到了1M的长度。这个处理级在目前以落地的大模型应用当中是很靠前的。

Qwen2.5-VL更加不用说,熟悉大模型行业的应该都知道,2024下半年,应用端一个大热的方向就是视觉模型的可用性,而通义的这个Qwen2.5-VL夺得十余项权威评测中的视觉理解冠军,全面超越GPT-4o与Claude3.5,也算是目前视觉模型中的稳健型选手,幻觉问题基本已经不存在,可用性非常高。

Qwen2.5-Max全新升级发布,是通义团队对MoE模型的最新探索成果,在多项公开主流模型评测基准上录得高分,全面超越了目前全球领先的开源MoE模型以及最大的开源稠密模型。

所以总得来讲,通义的开源是做得比较务实的,一直在拓宽可用性的边界,在年末的这波热潮当中,新兴的黑马很争气,我们的传统大厂也没有丢脸。

0 阅读:22
互联三爷

互联三爷

感谢大家的关注