说一个炸锅消息!
美国硬件媒体Tom‘s Hardware发表文章,称DeepSeek已经绕过了CUDA,使用更底层的编程语言icon做优化,也就是PTX语言。
所以程序员都会使用CUDA编程,这也是英伟达最重要的护城河之一。
如果DeepSeek真的绕开了CUDA,直接在PTX层面编程优化,那就意味着DeepSeek也有能力使用其他GPU、在汇编层面进行优化,从而摆脱对CUDA和英伟达的依赖。
事实上,DeepSeek在v3模型的论文中,曾提到过PTX编程的细节。
你老美现在不是连阉割版的H20芯片都要禁售吗?无所吊谓,市面上又不是只有n卡。
比如AMDicon,已经在MI300X GPU中集成了DeekSeek v3模型,我相信华为也会这么做,因为市面上的GPU架构就那么几款,并不复杂。
更炸裂的是:Llama.cpp项目中,有人使用DeekSeek-R1编写底层代码,从而把WeAssembly的速度提升了2倍,这意味着什么?
这意味着以后要移植到不同的GPU平台上,DeepSeek甚至可以自己生成汇编代码,然后快速移植,从而使整个AI行业,都不再受英伟达CUDA的垄断,甚至还有可能使用LPU芯片,类似Gorg模型,从而彻底摆脱GPU的束缚。
反正现在已经有人提示这种可能性了:Llama蒸馏的DeepSeek R1模型,在LPU上运行速度惊人,这意味着如果有更多的LPU方案,那AI黑马可能真的会颠覆英伟达的估值泡沫,下一个AI核弹,正在酝酿中。
昨天鲍威尔还罕见的提到了美国股市,他说AI的抛售不可持续,等于直接开嘴炮护盘,不过他也指出,现阶段资产价格确实偏高。
美联储主席直接出面稳定股市情绪,足以说明现在的资金有多恐慌,美股用OpenAIicon+英伟达精心构筑的资本泡沫,正在被另外一条未曾设想的道路所动摇,而这条由中国AI公司搭建的道路,才刚刚启程,各位可一定要心里有数!
用户10xxx74
Ds是用汉语而不是英语思维逻辑的
陈醉 回复 01-31 22:54
唉,物理是共通的。
fengpc
DeepSeek用PTX写的也就是英伟达的汇编语言,这种优化方法是强硬件相关的,同样的代码搬到别的型号GPU上都不一定好使。英伟达强的是整套大型系统的集成方案,通过光线网络的nvlink互联。DS让西方震惊的是他的高效率实现方案
fengpc 回复 02-01 19:57
DS巧妙的实现方法能让 AI大模型更加普及,以后让大家买更多的GPU
fengpc 回复 02-03 19:16
开源了,别家也可以移植。人家不一样是用英伟达训练的,该买卡的还是要买,做预训练一样需要很大的算力,做模型微调和数据蒸馏才不需要那么多
血色
为了维护美国国家安全,为了维护美国科技领先地位,以后中国所有高科技技术和产品都将不在向美国提供和展示,立刻停止DS对美国开源和注册,对已经使用和下载源码的必须停止使用,不然将处以巨额贷款。其他技术按此执行。美国永远第一。
老K
它能自己生成汇编代码,把自己移植到别的显卡上去,就相当于是繁殖(复制)了!一个生命体已经开始在网络上有显卡的地方寄生自己的复制体,潜伏在那里默默地吃着经过的数据,自己训练自己,自己提高自己!成为一个网路空间中的幽灵,拥有了超级智慧!
用户68xxx59
小编是不是吹过了?不用N卡用A卡,Amd也是美国的,这么尬吹真的让人无地自容。
用户10xxx75 回复 02-02 07:51
美国离开外国的技术和人才,什么也没有
打狗不看主人 回复 02-01 21:16
唉,你这智商还出来显摆,无脑吹的1450狗腿子。[捂脸哭]
书同文车同轨
中国加油。。
赐梦令
哪天出个中国计算机语言,世界最强科技属于中国。
最菜的菜鸟 回复 02-01 10:47
在冯诺依曼架构下,开发语言不重要。因为最后都是在这套架构下运行的,高级语言只是牺牲性能,让人类更好做开发而已。。。[哭笑不得]
z111111a 回复 最菜的菜鸟 02-01 20:04
能不能自己搞一个冯大刚架构?
冬雪
老美在家自己玩,对外封锁就是掩耳盗铃式的自废武功。
黑豆看世界
2003年,很多人就说过,国内程序猿是用鼠标搭建程序乐高积木的过程,而不是构建积木系统!而不是搞算法、驱动、系统研究!这与西方差距很大!现在终于追上来了!
黑豆看世界
2003年,很多人就说过,国内程序猿是用鼠标搭建程序乐高积木的过程!而不是搞算法、驱动、系统研究!这与西方差距很大!现在终于追上来了!