【据此投资，盈亏自负】DeepSeek推出的DeepSeek-V3和DeepSe

【据此投资，盈亏自负】DeepSeek推出的DeepSeek-V3和DeepSeek-R1两款大型语言模型，确实具有很强的竞争力。以下是对这两款模型的分析以及相关概念股： DeepSeek-V3和DeepSeek-R1的优势 • 高性能：DeepSeek-V3采用了混合专家（MoE）架构，参数总量高达6710亿，但每次推理仅激活370亿参数。在多项基准测试中，DeepSeek-V3展现出超越Claude Sonnet的能力，其推理能力在数学、编程和自然语言推理等方面表现突出。 • 低成本：DeepSeek-V3的训练成本约为557万美元，仅用2048块性能较弱的Nvidia H800芯片，在两个月内完成训练。相比之下，Meta LLaMa 3系列模型的训练成本要高得多。此外，DeepSeek-V3的推理成本也极具竞争力，输入/输出每百万Tokens的成本仅为Sonnet-3.5的1/10。相关概念股股权关联方 • 浙江东方（600120）：通过旗下杭州东方嘉富基金参与DeepSeek天使轮投资。 • 华金资本（000532）：通过华金领越基金间接参与DeepSeek Pre-A轮融资。算力基础设施供应商 • 浪潮信息（000977）：为DeepSeek北京亦庄智算中心提供AI服务器集群。 • 中科曙光（603019）：承建DeepSeek杭州训练中心的液冷系统。 • 润泽科技（300442）：为DeepSeek提供廊坊数据中心3000+机柜资源。 • 并行科技（839493）：为DeepSeek提供多种并行计算技术手段。垂直领域合作方 • 拓尔思（300229）：与DeepSeek联合开发金融舆情大模型。 • 科大讯飞（002230）：接入DeepSeek-Math模型，联合推出AI数学辅导应用“星火助学”。 • 金山办公（688111）：WPS智能写作功能集成DeepSeek-Writer API。数据与生态合作伙伴 • 每日互动（300766）：牵头的浙江大数据计算中心为DeepSeek提供算力支持，同时提供海量用户行为语料数据。 • 卓创资讯（301299）：其数据资源可能被用于DeepSeek模型的训练和优化。技术合作潜力股 • 飞利信（300287）：采用的MLA技术与DeepSeek-V2的架构创新有相似之处。 • 南威软件（603636）：在人工智能领域的技术与DeepSeek的技术方向存在契合点。其他潜在受益方向 • AI芯片与硬件：寒武纪、景嘉微等国产AI芯片制造商。

0 阅读：74