De­e­p­S­e­ek是个很优秀的大语言模型,它的推理成本低、强推理能力

铭铭谈科技 2025-02-10 23:07:55

De­e­p­S­e­ek 是个很优秀的大语言 模型,它的推理成本低、强推理能力等优势,出来后公司第一 时间做了验证和本地化部署,接入到了 Bl­a­c­k­E­ye 大模型的框架 里,用来做语言推理。但并不是简单的集成,基于公司自己的 数据,对蒸馏版本做了优化训练。De­e­p­S­e­ek 发布的蒸馏版本全 部是基于 SFT 做的,当虹是基于自己的数据做强化训练,对推 理能力进一步得到了提升。

团队创新的研发生成式框架用于视觉任务的 理解,如视频分割、深度提取等,产出了很多优秀论文,如De­p­t­h­A­ny-Vi­d­eo 在深度估计领域在学术界是最领先成果

0 阅读:30
铭铭谈科技

铭铭谈科技

感谢大家的关注