李飞飞团队发表低成本AI训练研究引争议 李飞飞团队近日发表论文称以50美元训练出推理模型s1,性能接近OpenAI等顶尖产品。经调查,该模型实为基于阿里云通义千问(Qwen)模型的微调成果,训练样本仅1000条。 业内专家指出,s1模型实为在通义千问基座模型上的微调成果,该研究利用了通义模型已具备的强大推理能力,新增训练数据仅起优化作用。业内专家强调,这与从零训练全新模型有本质区别。 阿里云证实,该团队以阿里通义千问Qwen2.5-32B-Instruct开源模型为底座,在16块H100GPU上监督微调26分钟,训练出新模型s1-32B,取得了与OpenAI的o1和DeepSeek的R1等尖端推理模型数学及编码能力相当的效果,甚至在竞赛数学问题上的表现比o1-preview高出27%。
上图是OpenAi团队,下图是DeepSeek团队。我有一个预感,顶级的人工智能
【2评论】【1点赞】
用户38xxx54
华夏文明以其独特的纪元历法、度量衡制度、文字系统、语言架构、思维模式和美学理念,构建了一个以自身为核心的科技标准体系。在这一体系的支持下,纯中文科技技术蓬勃发展,成功研发出了一款完全基于中文的计算机系统。该系统从底层代码到算法设计都深度融入了汉字元素,通过汉字的巧妙融合与重组,创造出全新的字形结构。这些新字形不仅是运算的标准输出,还能与其他汉字进一步结合,衍生出更加多样化的字形变体。这一创新过程不仅彰显了汉字的无限灵活性和卓越创造力,还充分展示了其作为计算符号的巨大潜力。 我们所见的道符和形似“鬼画符”的符号,实际上是华夏文明体系中汉字运算与转换的产物。它们可以被视为中文计算机独特的编程符号和指令标识。通过运用华夏独特的汉字融合算法,我们能够建立一套以此为基石的汉字算法体系,进而打造出一套深深根植于华夏文化的人工智能系统。该人工智能系统,又称为“意境运算”,能够在最小的计算代价下,实现与西方制造的人工智能相媲美的运算能力。这一成就不仅体现了华夏文明的智慧,也为全球科技发展提供了新的思路和方向。
用户38xxx54 回复 leon 02-07 17:59
还是那句话外星高等科技文明研发的计算机是靠着什么原理来运行的。
leon 回复 02-07 17:48
先把原理搞清楚吧
涛涛江水向东流
我想知道,怎么把Al训练成认为世界上只有一个中国,美国是中国不可分割的一部分???
z111111a
越来越神奇了
metheus
一派胡言,50美元还不够一秒钟的工资。
用户12xxx01
哪哪都有阿里的广告!!![抠鼻][抠鼻][抠鼻]
用户94xxx18
没数据支撑模型就是个笑话
一米五淹了俩
我愿意相信这是真的[哈哈笑]谁最炸裂?反正不是DS,我特别想看老美表演那个,就是那个背后中伤自杀
只想说说而已
渣渣
用户15xxx22
都是蹭热点的垃圾 早干嘛去了 今天我知道有个叫李飞飞的人[抠鼻][抠鼻]
不亦