DeepSeek:重塑AI产业格局,维持传媒行业“推荐”评级 借助AI算法,企业能够精准剖析用户偏好,达成个性化内容推荐,从而提升用户参与度与留存率,强化自身市场竞争力。 DeepSeek - V3/R1的推出,标志着中国在全球AI领域的技术引领地位,极大地鼓舞了全球AI产业的信心,为AI产业的长远增长注入强大动力。借助AI算法,企业能够精准剖析用户偏好,达成个性化内容推荐,从而提升用户参与度与留存率,强化自身市场竞争力。同时,AI可依据企业需求生成创意内容,为影视、动漫、游戏等领域提供丰富的创意灵感,推动行业内容的多元化发展。所以,维持传媒行业“推荐”评级。 主要观点如下: DeepSeek - V3和R1模型凭借优异的性能与创新的技术,迅速在全球AI领域崭露头角。 2024年12月26日,公司推出全新系列模型DeepSeek - V3并同步开源。DeepSeek - V3为自研MoE模型,多项评测成绩超越Qwen2.5 - 72B和Llama - 3.1 - 405B等其他开源模型,在性能上与世界顶尖的闭源模型GPT - 4o以及Claude - 3.5 - Sonnet不相上下。 2025年1月20日,DeepSeek发布推理模型DeepSeek - R1,该模型在后训练阶段大规模运用强化学习技术,在仅使用极少标注数据的情况下,极大地提高了模型推理能力,在数据、代码、自然语言推理等任务上,性能与OpenAI o1正式版相当。 DeepSeek - V3技术创新:架构优化与训练效率提升 DeepSeek - V3在继承DeepSeek - V2高效架构的基础上,通过创新的负载均衡策略和多标记预测(MTP)目标,进一步优化模型性能。该模型率先采用无需辅助损失的负载均衡策略,有效减少了因负载均衡导致的性能下降。同时,MTP目标不但提升了模型性能,还支持推理加速中的推测性解码。 在预训练阶段,DeepSeek - V3借助FP8混合精度训练框架以及算法、框架、硬件的协同设计,克服了跨节点MoE训练中的通信瓶颈,实现了计算与通信的高效重叠,显著提高了训练效率并降低了成本。最终,仅以266.4万H800GPU小时的经济成本完成了在14.8万亿标记上的预训练,成为当前最强的开源基础模型。在后训练阶段,DeepSeek - V3通过知识蒸馏技术,将长链推理(CoT)模型的推理能力融入其中,显著提升了推理性能,同时保持了输出风格和长度的可控性。 科技巨头纷纷接入DeepSeek,推动全球AI生态发展 2025年1月30日,英伟达宣布DeepSeek - R1模型作为NVIDIANIM微服务预览版上线,为企业提供高效推理服务。紧接着,1月29日,微软将DeepSeek - R1纳入AzureAI Foundry平台,支持企业通过无服务器端点访问该模型。 此外,DeepSeek - R1还上线了GitHubModels,开发者可免费试用。2月1日,硅基流动与华为云联合发布基于昇腾云服务的DeepSeek R1/V3推理服务,凭借自研推理加速引擎,该服务在性能上与全球高端GPU部署模型相当,同时提供稳定、生产级的服务能力,满足大规模商用需求,并依托华为云昇腾云服务的强大算力支持。 投资建议: 建议重点关注三七互娱(002555.SZ)、姚记科技(002605.SZ)、昆仑万维(300418.SZ)、世纪天鸿(300654.SZ)、上海电影(601595.SH)、博纳影业(001330.SZ)、光线传媒(300251.SZ)、万达电影(002739.SZ)、视觉中国(000681.SZ)、汤姆猫(300459.SZ)、实丰文化(002862.SZ)。 风险提示:市场需求增长不及预期、技术研发进展不及预期、竞争加剧导致盈利空间受限风险、外部环境风险、政策支持风险。
DeepSeek:重塑AI产业格局,维持传媒行业“推荐”评级 借助AI算法,企业
毅财才
2025-02-11 02:02:20
0
阅读:18