DeepSeekDeepSeek什么来头,何以震动全球AI圈?ai创造营

家家说科技 2025-01-28 17:57:18

DeepSeek DeepSeek什么来头,何以震动全球AI圈? ai创造营

由国内大模型公司“深度求索”开发的DeepSeek应用推出的DeepSeek-V3在全球AI领域掀起巨大波澜,它以极低的训练成本,实现了与GPT-4o等顶尖模型相媲美的性能。时隔不到一个月,DeepSeek又一次震动全球AI圈。1月27日,随着DeepSeek推出新模型DeepSeek-R1,Deepseek应用登顶苹果中国地区和美国地区应用商店免费App下载排行榜,在美区下载榜上超越了ChatGPT。

北京时间今日(28)凌晨,DeepSeek又发大招,宣布开源全新的视觉多模态模型Janus-Pro-7B。Janus的表现超越了传统的统一模型,有望成为下一代统一多模态模型的有力竞争者。那么,DeepSeek究竟好在哪?为什么能以较低的成本取得“大力出奇迹”的效果?

DeepSeek:性能卓越,用户体验佳DeepSeek是一款由国内人工智能公司研发的大型语言模型,简单来说,它就像是一个聪明又懂你的助手。它拥有强大的自然语言处理能力,能够理解并回答你的问题,就像你和朋友聊天一样自然流畅。

而且,DeepSeek不仅能聊天,还能帮你写代码、整理资料,甚至能帮你解决一些复杂的数学问题。它背后有着复杂的算法和大量的数据支持,就像是一个经验丰富的侦探,能从海量信息中挖掘出你想要的东西。关于类似的大模型,最广为人知的可能是OpenAI开发的ChatGPT。从2024年9月OpenAI发布o1-preview到现在,仅过去不到四个月,市场上媲美甚至超越其性能的推理模型就已遍地开花。DeepSeek之所以可以从这众多的模型之中异军突起,是因为它不仅率先实现了媲美OpenAI-o1模型的效果,更是将推理模型的成本压缩到了极低。

这次DeepSeek推出的新模型DeepSeek-R1延续了其高性价比的优势,仅用十分之一的成本就达到了GPT-o1级别的表现。“从大力出奇迹到小力出奇迹”DeepSeek做了什么算法改进?DeepSeek模型发布后,瞬间引发了海外AI圈众多科技大佬的讨论。当地时间1月27日,受DeepSeek冲击,美国人工智能主题股票遭抛售,美国芯片巨头英伟达(NVIDIA)股价历史性暴跌,纳斯达克综合指数大幅下跌。英伟达高级研究科学家Jim Fan在个人社交平台上公开发表推文表示,“我们正身处这样一个历史时刻:一家非美国公司正在延续OpenAI最初的使命——通过真正开放的前沿研究赋能全人类。看似不合常理,但最有趣的结局往往最可能成真。”

现在DeepSeek给大家一个启示——虽然DeepSeek算力不高,数据可能也不是很多,但通过算法的优化可以做得更好。

0 阅读:33
家家说科技

家家说科技

感谢大家的关注