DeepSeekDeepSeek什么来头，何以震动全球AI圈？ai创造营

DeepSeek DeepSeek什么来头，何以震动全球AI圈？ ai创造营

由国内大模型公司“深度求索”开发的DeepSeek应用推出的DeepSeek-V3在全球AI领域掀起巨大波澜，它以极低的训练成本，实现了与GPT-4o等顶尖模型相媲美的性能。时隔不到一个月，DeepSeek又一次震动全球AI圈。1月27日，随着DeepSeek推出新模型DeepSeek-R1，Deepseek应用登顶苹果中国地区和美国地区应用商店免费App下载排行榜，在美区下载榜上超越了ChatGPT。

北京时间今日（28）凌晨，DeepSeek又发大招，宣布开源全新的视觉多模态模型Janus-Pro-7B。Janus的表现超越了传统的统一模型，有望成为下一代统一多模态模型的有力竞争者。那么，DeepSeek究竟好在哪？为什么能以较低的成本取得“大力出奇迹”的效果？

DeepSeek：性能卓越，用户体验佳DeepSeek是一款由国内人工智能公司研发的大型语言模型，简单来说，它就像是一个聪明又懂你的助手。它拥有强大的自然语言处理能力，能够理解并回答你的问题，就像你和朋友聊天一样自然流畅。

而且，DeepSeek不仅能聊天，还能帮你写代码、整理资料，甚至能帮你解决一些复杂的数学问题。它背后有着复杂的算法和大量的数据支持，就像是一个经验丰富的侦探，能从海量信息中挖掘出你想要的东西。关于类似的大模型，最广为人知的可能是OpenAI开发的ChatGPT。从2024年9月OpenAI发布o1-preview到现在，仅过去不到四个月，市场上媲美甚至超越其性能的推理模型就已遍地开花。DeepSeek之所以可以从这众多的模型之中异军突起，是因为它不仅率先实现了媲美OpenAI-o1模型的效果，更是将推理模型的成本压缩到了极低。

这次DeepSeek推出的新模型DeepSeek-R1延续了其高性价比的优势，仅用十分之一的成本就达到了GPT-o1级别的表现。“从大力出奇迹到小力出奇迹”DeepSeek做了什么算法改进？DeepSeek模型发布后，瞬间引发了海外AI圈众多科技大佬的讨论。当地时间1月27日，受DeepSeek冲击，美国人工智能主题股票遭抛售，美国芯片巨头英伟达（NVIDIA）股价历史性暴跌，纳斯达克综合指数大幅下跌。英伟达高级研究科学家Jim Fan在个人社交平台上公开发表推文表示，“我们正身处这样一个历史时刻：一家非美国公司正在延续OpenAI最初的使命——通过真正开放的前沿研究赋能全人类。看似不合常理，但最有趣的结局往往最可能成真。”

现在DeepSeek给大家一个启示——虽然DeepSeek算力不高，数据可能也不是很多，但通过算法的优化可以做得更好。

0 阅读：33