DeepSeek 是个很优秀的大语言 模型,它的推理成本低、强推理能力等优势,出来后公司第一 时间做了验证和本地化部署,接入到了 BlackEye 大模型的框架 里,用来做语言推理。但并不是简单的集成,基于公司自己的 数据,对蒸馏版本做了优化训练。DeepSeek 发布的蒸馏版本全 部是基于 SFT 做的,当虹是基于自己的数据做强化训练,对推 理能力进一步得到了提升。
团队创新的研发生成式框架用于视觉任务的 理解,如视频分割、深度提取等,产出了很多优秀论文,如DepthAny-Video 在深度估计领域在学术界是最领先成果