DeepSeek无预告更新V3模型 昨晚,DeepSeek毫无预告的情

绮梅谈科技 2025-03-25 11:22:27

DeepSeek 无预告更新 V3 模型 昨晚,DeepSeek 毫无预告的情况下,在 Hugging Face上放出了最新的 DeepSeek-V3-0324 模型。 先来看重点:DeepSeek-V3-0324 模型参数达 685B,目前在官方网站、APP 和小程序上已经可以体验(关闭深度思考)。 本次更新为小版本更新,并非此前呼声较高的 DeepSeek-R2,但依然有不少亮点,甚至在某些能力已经与 Claude 3.7 Sonnet 相当接近。从网友反馈的实测效果来看,V3-0324 有这些提升: -编码能力已经接近 Claude3.7 了,比之前的老版本 v3 能力要强; -提升幅度大约与 Sonnet 3.5 到 Sonnet 3.6 一样,甚至还要大一点; -与 R1 相比,V3-0324 在生成前端代码方面有了明显改进; -数学能力也有提升,能像推理模型一样能够解题。 DeepSeek-V3-0324 依然保持着开源的优良传统,而且是 MIT 开源许可,意味着比上一版更加开放了。

0 阅读:0
绮梅谈科技

绮梅谈科技

感谢大家的关注