写了12000字的文章科普deepseek技术细节，先聊些别的。有胡锡进为例，警

写了12000字的文章科普deepseek技术细节，先聊些别的。有胡锡进为例，警惕大模型瞎编

1. 大众基本不知道deepseek等大模型是怎么生成回答的。一个亲戚还问它春节后买什么股好，都不知道要点上“联网搜索”、“深度思考”，结果回答的是2024年春节后买股选择，像模像样。

2. 大模型回答结果是矩阵运算出来的，每个字输出，都是概率性地从一堆“合理”的词里挑选一个。什么叫“合理”，就是从人类语料里出现的多，就可以！自然，它天生是“语言大模型”。先在语言形式上，达到了超过任何人的水平。人们说话，写作，把语言形式展现得极为充分，每个字都被概率包围得死死的。但是，很多人类语料是吹牛逼、编瞎话、无知、偏见、鬼扯，充满了认知错误。

3. 而研究者和高水平用户，是希望大模型能“推理”。连输出过程都叫“推理”，和“训练”对应。另外，还希望它是个“事实大模型”，不要学了人类的不靠谱。但是，目前大模型还是问题很大。一个是很多人知道的“幻觉”现象，一个是对于人类提供的真假信息的分辨能力。

4. “幻觉”，就是没信息自己瞎编。本来大模型输出的信息就是矩阵计算的结果，有信息素材训练的，能说些相关的话。要是训练里没素材呢？毫无问题，根据概率瞎编很容易，形式上和真话一模一样。随着deepseek火爆，我注意到很多人被它一本正经的瞎话蒙住了，完全意识不到是瞎编。

5. 这种现象已经非常严重了。图二是胡锡进让deepseek回答的，里面内容大部分是瞎编。什么8.2亿元算力、量子加密防线、研发团队工作重置、烛龙异构框架、时空折叠算法、未来穿越来的技术、合肥光子计算机跑通1750亿参数原型，全是瞎编的！但是编得很像模像样，有点影，合肥是有光量子计算机在研发。

6. 以前也就算了，chatgpt用不上。现在deepseek很火，水平很高，编瞎话的水平也特别高。感觉影响有些失控，互联网上会有不少deepseek瞎编的信息。强烈建议，如果不是联网搜索、深度搜索的，输出一定要小心。

7. 联网搜索，会先找网上信息学习，输出有依据，靠谱多了，不是完全幻觉瞎编。但是网上信息也真真假假。deepseek的深度思考很厉害，能判断真假信息，比较矛盾的信息，验证、反思。这就好多了，虽然还是会瞎编一些东西，网上信息也不一定能分辨完善。个人感觉已经比一般人对信息真假的分析能力强多了。

8. 但是，一般人说的，我们知道很可能不靠谱，会小心。而deepseek等高水平大模型说的，正因为水平高，九真一假的水平也特别高，需要特别小心查证。

0 阅读：45