推理类大语言模型的可视化指南
newsletter.maartengrootendorst.com/p/a-visual-guide-to-reasoning-llms
Maarten Grootendorst(Hands-On Large Language Models一书的作者)写的一篇长文。用大量的图表介绍了推理类大语言模型(如DeepSeek-R1, OpenAI o3-mini等)的技术原理、训练方法以及与传统LLMs的区别。特别详细的介绍了DeepSeek-R1相关的内容。
----与其让LLMs学习“回答什么”,不如让他们学习“如何回答”