写了12000字的文章科普deepseek技术细节,先聊些别的。有胡锡进为例,警

烨华聊商业 2025-02-05 10:21:18

写了12000字的文章科普deepseek技术细节,先聊些别的。有胡锡进为例,警惕大模型瞎编

1. 大众基本不知道deepseek等大模型是怎么生成回答的。一个亲戚还问它春节后买什么股好,都不知道要点上“联网搜索”、“深度思考”,结果回答的是2024年春节后买股选择,像模像样。

2. 大模型回答结果是矩阵运算出来的,每个字输出,都是概率性地从一堆“合理”的词里挑选一个。什么叫“合理”,就是从人类语料里出现的多,就可以!自然,它天生是“语言大模型”。先在语言形式上,达到了超过任何人的水平。人们说话,写作,把语言形式展现得极为充分,每个字都被概率包围得死死的。但是,很多人类语料是吹牛逼、编瞎话、无知、偏见、鬼扯,充满了认知错误。

3. 而研究者和高水平用户,是希望大模型能“推理”。连输出过程都叫“推理”,和“训练”对应。另外,还希望它是个“事实大模型”,不要学了人类的不靠谱。但是,目前大模型还是问题很大。一个是很多人知道的“幻觉”现象,一个是对于人类提供的真假信息的分辨能力。

4. “幻觉”,就是没信息自己瞎编。本来大模型输出的信息就是矩阵计算的结果,有信息素材训练的,能说些相关的话。要是训练里没素材呢?毫无问题,根据概率瞎编很容易,形式上和真话一模一样。随着deepseek火爆,我注意到很多人被它一本正经的瞎话蒙住了,完全意识不到是瞎编。

5. 这种现象已经非常严重了。图二是胡锡进让deepseek回答的,里面内容大部分是瞎编。什么8.2亿元算力、量子加密防线、研发团队工作重置、烛龙异构框架、时空折叠算法、未来穿越来的技术、合肥光子计算机跑通1750亿参数原型,全是瞎编的!但是编得很像模像样,有点影,合肥是有光量子计算机在研发。

6. 以前也就算了,chatgpt用不上。现在deepseek很火,水平很高,编瞎话的水平也特别高。感觉影响有些失控,互联网上会有不少deepseek瞎编的信息。强烈建议,如果不是联网搜索、深度搜索的,输出一定要小心。

7. 联网搜索,会先找网上信息学习,输出有依据,靠谱多了,不是完全幻觉瞎编。但是网上信息也真真假假。deepseek的深度思考很厉害,能判断真假信息,比较矛盾的信息,验证、反思。这就好多了,虽然还是会瞎编一些东西,网上信息也不一定能分辨完善。个人感觉已经比一般人对信息真假的分析能力强多了。

8. 但是,一般人说的,我们知道很可能不靠谱,会小心。而deepseek等高水平大模型说的,正因为水平高,九真一假的水平也特别高,需要特别小心查证。

0 阅读:45
烨华聊商业

烨华聊商业

感谢大家的关注