它被称为 “AI 界拼多多”,好用又实惠。 价格却只有同类模型的 10%,且免费开源。 DeepSeek火爆得益于算法创新。 其在算法上投入早、积累多,通过使用强化学习技术、优化模型架构和创新数据处理方式。 降低了算力成本,提升了模型推理能力,实现了高性能与低成本的平衡。 它利用幻方量化积累的资源,专注工程技术和算法突破,模型开源和公开技术报告赢得开发者好评。 技术指标对比 指标 DeepSeek-192B GPT-4 Claude 3 MMLU综合得分 86.5 86.4 85.9 代码生成(HumanEval) 81.7% 78.2% 79.5% 推理速度(tokens/s) 3200 1800 2500 训练能耗(PUE) 1.08 1.12 1.15 (数据来源:2024年MLCommons基准测试) AI的发展有三大支柱:应用、算法、算力。 算力需要硬件,而米国对我们实行芯片制裁已有多年,算法也是米国在主导。 如今算法也被我们攻破,算力就算低核卡,我们也能提速10倍以上。 这让硅谷那帮将模型和硬件用钱堆上天的投资家们情何以堪,本想着用AI将其实国家甩在身后的。 回头一看,我们不讲武德,DeepSeek非要进行算力创新和突破,将行业成本降低一大半,使用难度也大大降级。 那种反人类的提示词,要人工学习机器语言,也可以抛弃了。 梁文峰讲过:我们要逐渐成为创新贡献者,在AI领域不可能永远跟随。 当然真正懂AI技术的没有多少,更多是道听途说。 如果你把它当搜索工具用,应答速度很快; 如果跟它进行探讨,它需要思考,还会把思考过程贴出来; 如果用来中文写作的话,比ChatGPT还好一点,! 点赞收藏防失联,转发分享,快乐+1!
它被称为“AI界拼多多”,好用又实惠。 价格却只有同类模型的10%,且免费
阳泽与世界
2025-01-28 18:57:23
0
阅读:45