美媒称DeepSeek新突破如同一场地震中国深度求索（DeepSeek）公司发

美媒称DeepSeek新突破如同一场地震中国深度求索（DeepSeek）公司发布的最新开源模型在全球范围内引发了热议。美国媒体将其描述为人工智能领域的一场“地震”，声称“从华盛顿到华尔街再到硅谷都感受到了震动”。这一评价绝非夸张之词，深度求索的此次突破正深刻地影响着全球人工智能的发展格局，给行业带来了全新的变革和挑战。

深度求索的模型在性能上表现卓越，其发布的DeepSeek - R1模型，性能几乎可以媲美萨姆·奥尔特曼创立的OpenAI开发的模型，然而成本却仅为后者的零头。不仅如此，DeepSeek - V3在众多基准测试中也超越了GPT - 4o和Claude 3.5 sonnet等知名模型。在数学、代码、自然语言推理等任务上，DeepSeek - R1的测评性能与GPT - o1模型正式版接近。它能够取得这样的成绩，并非依靠堆砌硬件资源，而是凭借巧妙的工程设计和高效的训练方法。通过采用诸如混合专家（MoE）架构、多头潜在注意力（MLA）等创新技术，以及在训练过程中使用辅助损失自由负载均衡等策略，深度求索极大地提升了模型的性能，同时降低了训练和部署成本。这一突破直接挑战了人工智能发展长期以来的核心信念——认为更强大的硬件才是推动人工智能发展的关键。它向世界证明了，在人工智能领域，通过优化算法和模型架构，同样可以实现卓越的性能，打破了“更大即更聪明”的固有观念。

从商业应用的角度来看，深度求索的开源模型具有巨大的价值。对于大多数商业用户而言，拥有一款足够可靠并且好用的模型比拥有绝对领先的模型更为重要。深度求索的模型推理能力不断进步，能够为与客户互动或处理工作任务的“智能体”带来突破性变化。而且，由于其成本低廉，企业可以以更低的成本拥有这些模型，从而显著提升自身的盈利能力。这使得中小企业能够在不依赖昂贵专有服务的情况下，部署人工智能驱动的解决方案；开发者也能够更加自由地进行实验，无需担心超出预算；新兴市场的企业则能够更轻松地引入人工智能解决方案，推动金融、医疗、教育等多个行业的发展。其开源的特性更是吸引了全球众多开发者的关注，开源意味着任何人都可以在其基础上进行二次开发和创新，这无疑将极大地推动人工智能技术的普及和应用，促进整个行业的发展。

深度求索的成功也让美国的相关政策面临着新的审视。长期以来，美国政府为了遏制中国在人工智能等高科技领域的发展，实施了一系列的芯片出口限制政策，试图从硬件层面限制中国人工智能产业的进步。然而，深度求索的此次突破表明，美国的这些限制措施

0 阅读：0