【据此投资,盈亏自负】DeepSeek推出的DeepSeek-V3和DeepSeek-R1两款大型语言模型,确实具有很强的竞争力。以下是对这两款模型的分析以及相关概念股: DeepSeek-V3和DeepSeek-R1的优势 • 高性能:DeepSeek-V3采用了混合专家(MoE)架构,参数总量高达6710亿,但每次推理仅激活370亿参数。在多项基准测试中,DeepSeek-V3展现出超越Claude Sonnet的能力,其推理能力在数学、编程和自然语言推理等方面表现突出。 • 低成本:DeepSeek-V3的训练成本约为557万美元,仅用2048块性能较弱的Nvidia H800芯片,在两个月内完成训练。相比之下,Meta LLaMa 3系列模型的训练成本要高得多。此外,DeepSeek-V3的推理成本也极具竞争力,输入/输出每百万Tokens的成本仅为Sonnet-3.5的1/10。 相关概念股 股权关联方 • 浙江东方(600120):通过旗下杭州东方嘉富基金参与DeepSeek天使轮投资。 • 华金资本(000532):通过华金领越基金间接参与DeepSeek Pre-A轮融资。 算力基础设施供应商 • 浪潮信息(000977):为DeepSeek北京亦庄智算中心提供AI服务器集群。 • 中科曙光(603019):承建DeepSeek杭州训练中心的液冷系统。 • 润泽科技(300442):为DeepSeek提供廊坊数据中心3000+机柜资源。 • 并行科技(839493):为DeepSeek提供多种并行计算技术手段。 垂直领域合作方 • 拓尔思(300229):与DeepSeek联合开发金融舆情大模型。 • 科大讯飞(002230):接入DeepSeek-Math模型,联合推出AI数学辅导应用“星火助学”。 • 金山办公(688111):WPS智能写作功能集成DeepSeek-Writer API。 数据与生态合作伙伴 • 每日互动(300766):牵头的浙江大数据计算中心为DeepSeek提供算力支持,同时提供海量用户行为语料数据。 • 卓创资讯(301299):其数据资源可能被用于DeepSeek模型的训练和优化。 技术合作潜力股 • 飞利信(300287):采用的MLA技术与DeepSeek-V2的架构创新有相似之处。 • 南威软件(603636):在人工智能领域的技术与DeepSeek的技术方向存在契合点。 其他潜在受益方向 • AI芯片与硬件:寒武纪、景嘉微等国产AI芯片制造商。
【据此投资,盈亏自负】DeepSeek推出的DeepSeek-V3和DeepSe
苏盆在上海
2025-01-26 12:19:44
0
阅读:74