50美元的ai模型部分能力媲美deepseek近日，一项来自斯坦福大学和华盛顿大

代芹聊趣事 2025-02-08 09:02:28

50美元的ai模型部分能力媲美deepseek

近日，一项来自斯坦福大学和华盛顿大学等机构的研究成果引起了市场关注，李飞飞等人以不到50美元的云计算费用成功训练出了一个名为s1的AI推理模型。研究成果表明，s1在数学和编码能力测试中与OpenAI的o1和DeepSeek的R1等模型的表现不相上下。

s1的研究团队表示，s1模型是以谷歌推理模型Gemini2.0 Flash Thinking Experimental为基础模型，通过蒸馏法提炼出来的。

他们采用了一种名为test-time scaling的方法。研究团队构建了一个小型数据集s1K，通过难度、多样性和质量三个标准来筛选，其中包括1000个经过精心挑选的问题以及相应答案，并附上了“推理”过程，仅使用了16台英伟达H100 GPU，耗时26分钟就完成了训练。

这种方法与传统的大规模强化学习方法（RL）形成鲜明对比，后者的成本通常较高，DeepSeek、OpenAI都采用了这种方法。而s1的研究通过较小的数据集和监督微调（SFT）蒸馏推理模型，大大降低了训练成本并提高了效率。

此外，为了提高答案的准确度，研究团队还运用了一种“预算强制”技术，可以控制测试时间计算，通过强制提前终止模型的思考过程，或在s1推理时多次追加“等待”指令以延长思考，从而优化性能。

根据研究团队的测试结果可知，在竞赛数学问题上，s1-32B的表现较o1-preview高27%（MATH和AIME24）；且该模型在AIME24上的表现几乎与Gemini 2.0 Thinking API相当，显示其蒸馏过程是有效的。

0 阅读：129

评论列表

Cl_Smoothcrew

3

2025-02-08 10:16

那又怎样，等人家火了再发出来，没人关注

晚枫

1

2025-02-08 10:03

专项的能和通用的做对比吗？

代芹聊趣事

感谢大家的关注

作者最新文章

1

哪吒2票房超过星球大战，成为全球单一市场最高纪录，以及2025全球票房冠军截至2

2

刷医保可买华为手表，但同等且更便宜的小米手表不行红星资本局发现，近期，有IP地为

3

网友举报人社局打电话辱骂，官方回应：属实，工作人员已当面赔礼道歉，停职调查2月6

4

50美元的ai模型部分能力媲美deepseek近日，一项来自斯坦福大学和华盛顿大

5

上亿粉丝主播辛巴徒弟被打假，官方立案，将行政处罚打假博主“蛙哥出击”发视频称，粉

6

政府回应被举报报告数据造假：已撤回修改近日，一男子发视频举报河南周口鹿邑县市场监

7

国家对部分轻微市场违法行为不处罚在充分考虑违法行为危害后果、当事人主观过错和获利

8

做了一套eva送后期小伙伴生日礼物，也是作为他送我擎天柱的回礼。rg版eva 初

9

给充电头升级下系统。制糖工厂的小电拼ultra又迎来了更新，这是春节也没闲着？优

10

山西大同一街道就网传“破门亮灯”事件致歉2月7日，山西大同平城区古城街道发布致歉

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

社会TOP

1

【#27岁男子超车致事故后竖中指被行拘#广东警方：他全责！】2月11日，广东

2

【#道明寺来跟杉菜告别了#】#杉菜去流星花园了#2月3日，据台媒消息，透过经纪

3

【#演员李明德被刑拘#】2月13日，北京青年报记者从北京朝阳警方获悉，近日接“朝

4

【#二月新规来了#】新国标对食品添加剂作出修改，更好保障“舌尖上的安全”；食用油

5

【#男子半夜回公司1年多盗窃460余万#：悄悄记下保险箱密码，公司盘账终发现】据

6

#全世界都在看东北人转手绢#【#亚冬会开幕式转手绢还会变色#[666]】亚冬会开

7

【#嵊州失联8天男孩已遭遇不幸#警方排除他杀】2月12日元宵节晚上，他去同学家

8

【#山东淄博一游乐园用驴充当斑马#，#游乐园称用驴充当斑马为宣传引流#】近日，有

9

【#小孩哥用1.5万压岁钱买股11天亏了55#】2012年出生的的杭州男孩轩轩，

10

【#凌晨3点她在车里生下第三胎#】凌晨三点多，城市的喧嚣早已沉寂。当大多数人还在

社会最新文章

1

【#河南一载26人大巴车高速上侧翻##河南一大巴车高速上侧翻致6人被送医#】2月

2

【#官方回应截瘫男子狱中感染艾滋病#：正帮办低保，会跟进后续治疗】#男子服刑期感

3

【入地10910米！#我国首口超万米科探井完钻#“深地”领域获重大突破】2月2

4

【#嵊州失联8天男孩已遭遇不幸#警方排除他杀】2月12日元宵节晚上，他去同学家

5

【#灌面汤呛死妻子案被告人当庭认罪认罚#】去年9月4日凌晨，陕西白水县39岁的小

6

【#小孩哥用1.5万压岁钱买股11天亏了55#】2012年出生的的杭州男孩轩轩，

7

#徐州一幼儿园被曝给孩子吃发霉鸡蛋#【#官方称幼儿园发霉鸡蛋事件已处置#：202

8

【#官方回应93岁强奸犯进行社区矫正#：年龄是考虑因素之一，也要看邻里是否同意】

9

老太拦婚车不成强砸？

10

【#川航回应61岁女子机上离世家属质疑#：下降前发现无应答】近日，有网友发帖称，