专家许成刚谈DeepSeek 没有大的创新,模型的性能跟其他AI技术是相似的,之所以有如此大的冲击力,主要在于它的成本低。 而且由于DeepSeek 是跟随性的技术革新,大量的使用蒸馏的方式,通俗的说就是DeepSeek 是学生模型,别人的是老师模型,DeepSeek 把老师模型里面核心内容蒸馏到自己技术里面。 这也是为什么李飞飞团队能够很迅速的在谷歌模型基础上研发出一个比DeepSeek 还要便宜的模型出来,就是因为使用了蒸馏技术。 专家许成刚对DeepSeek 的认知,网友并不买账 有网友认为,按照专家的说法,DeepSeek 是“学生模型”,加入“老师模型”的技术,那么是如何达到如此强大的震慑效果的呢?简单的蒸馏技术恐怕达不到 也有网友认为,这位专家说的一套一套,仿佛对DeepSeek 很了解,其实什么都不懂 还有网友认为,连OpenAI创始人都说DeepSeek 是了不起的创新,还没有说服力吗?
专家许成刚谈DeepSeek 没有大的创新,模型的性能跟其他AI技术是相似的,
时光旧影梦之桥
2025-03-08 14:50:33
0
阅读:42
用户10xxx86
只要不违法,不同的见解是可以发出来的,这是理性的科学探讨!