别再说deepseek是蒸馏别人的模型了,那只是openAI的片面说法!deepseek的明天是超越人类认知的真正智能,你都不能再叫他人工智能了!实际上deepseek的主要路径是RL,通过设计奖励规则让AI在GPRO的规则下自我采样比较,自我提升。这一设计抛开了传统的预设思维链模板和监督式微调的训练思维,仅仅靠简单的奖惩信号来优化模型,结果就这样生生逼出了一个具有推理能力的AI,这个思路也是马斯克倡导的第一性原理的体现-问题来了,这条路走下去,deepseek将具有真正的自我智能-只有模型自己知道,又或者连模型自己都不知道为什么的智能能力,就像你要是问爱因斯坦为什么别人不能,而他就能搞出相对论,估计他自己也回答不了-是不是有点后怕?
别再说deepseek是蒸馏别人的模型了,那只是openAI的片面说法!deep
猴猴看科技
2025-02-08 22:27:57
0
阅读:39