首先问一下Deepseek在哪些方面有技术上的创新,自己对自己应该更了解,也看它自己是怎么理解这个问题。可能原先对Deepseek做了一些提示引导,它首先给出了解题思路,理解用户提问意图并做任务分解,给出解题思维链。Deepseek的回答,有这么几点比较重要,动态因果注意力机制(DCA),多粒度语义理解网络,神经符号混合架构,这三点从目的上都是针对当前大模型推理能力弱所进行的改进和补充。多专家动态路由架构,是否可以理解为是MoE的架构,加快解题速度和准确性。总体上,Deepseek在大模型的基础架构上没有做革命性革新,主要针对大模型的推理弱点做了技术架构上的优化和补充。
首先问一下Deepseek在哪些方面有技术上的创新,自己对自己应该更了解,也看它
夜天看情感生活
2025-01-24 10:51:38
0
阅读:12