Deepseek现在火的一塌糊涂,一把洛杉矶的天然大火席卷了很多富豪的豪宅,一把Deepseek的大火席卷硅谷,烧了很多AI大佬的眉毛。大致了解了一下Deepseek在技术上的优化,主要有三个架构上的重构,动态因果注意力机制(DCA)、多粒度语义理解网络、神经符号混合架构,以及被广泛提及的GRPO训练策略。在我粗浅的理解力,Deepseek所做的工作,就是针对大模型完全的“暴力破解”学习方法,从网络结构和训练方法上,多引入外部知识导引,从而极大优化学习网络和催化训练效率,提升训练效果。
Deepseek现在火的一塌糊涂,一把洛杉矶的天然大火席卷了很多富豪的豪宅,一把
夜天看情感生活
2025-01-25 10:51:54
0
阅读:1