Qwen也赶在年前发新技术了！这次发布的是Qwen2.5-1M，具体包括Qwe

又仁看科技 2025-01-27 10:18:51

Qwen也赶在年前发新技术了！

这次发布的是Qwen2.5-1M，具体包括 Qwen2.5-7B-Instruct-1M 和 Qwen2.5-14B-Instruct-1M两个模型。最大的突破点是将上下文窗口扩展至了 100万Token。而且在 Passkey Retrieval 测试中，14B 模型在 100万令牌的上下文中实现了 100% 的准确率，7B 模型仅出现微小误差。在长文本处理这单项任务上甚至超过了 GPT-4o-mini。

0 阅读：0

又仁看科技

感谢大家的关注

作者最新文章

1

DeepSeek的性格真的有点像流浪地球里Moss。这个要从今天和DeepSee

2

ninehills（九原山）整理的一份DeepSeek R1 阅读清单 “随着

3

新春快乐！蛇年快乐！新的一年里：冒泡排序，选择排序，插入排序，快速排序，堆排序

4

？这个时间点上（已经听到春晚主持人在准备零点倒计时了），Qwen发了新模型 Qw

5

好壮观的Github Trending。。前10里9个项目都是deepseek的

6

ollama（方便在本地运行大模型的项目）发的中国新年祝福画的好萌，蛇年适合写P

7

尊界S800上春晚虽然买不起豪车，不过看豪车评测还挺有意思，各种小细节，有时

8

一张图看linux启动过程。制图:bytebytego步骤 1 - 开机后，BI

9

前OpenAI大神Andrej Karpathy 对DeepSeek R1的推文

10

卡内基梅隆大学（CMU）在2025年春季开设的一门公开课——“Machine L

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

科技TOP

1

mac你真的神了🫶

2

为什么央视不让苹果露出？在2024年春晚上，有一个细节值得注意，陈奕迅使用的

3

有点想换手机的冲动了

4

小米要破万亿市值了？太猛了，美国关税的情况下，小米都能猛涨[并不简单][加油]

5

多平台宣布上线DeepSeek大模型：腾讯云、阿里云、华为云、360、亚马逊A

6

2025年几乎零差评的几款手机！你认同哪一款？1.Magic72.OPPO

7

扎克伯格宣布2025年投入650亿美元，建立自己的AI大数据库，可是没想到这两天

8

马斯克才是2025最大的冤种！马斯克大选花了2.9亿美元，最后得了个弼马温的职位

9

4款2000档位的手机怎么选？这个价位，一般都是给孩子买的，玩游戏多一些

10

deepseek被用户训练得成精了！

科技最新文章

1

DeepSeek引发的蝴蝶效应！东大国2700多位院士，这几天热闹非凡，围绕孙

2

小米真成大公司了，忝列全球市值第100大。以前说小米是世界500强，很多人还

3

国补以后手机销量排名，打醒了多少人！太讽刺了，多少人和我一样，当看到第一名的时候

4

昨天雷军不是发了微博说，标是金子做的嘛，今天我专程替大家来环球港看了看。现在的金

5

【#澳禁止政府系统和设备使用DeepSeek#，澳部长辩称：不是针对中国】据澳

6

小米市值彻底失控估计就连雷军都想不到吧！才过去1个月时间，这哪里是超越和碾压，

7

2025年几乎零差评的几款手机！你认同哪一款？1.Magic72.OPPO

8

国补降价最狠的4款手机！嗯认同哪一款？1.荣耀Magic7，发布价4999，

9

荣耀手机哪几款比较值得入手？相信下面这4款一定不会让你失望。荣耀X60Pro

10

deepseek被用户训练得成精了！