【[77星]Caldera：用低精度和低秩分解技术压缩大型语言模型，让大模型也能

爱生活爱珂珂 2025-02-07 19:32:51

【[77星]Caldera：用低精度和低秩分解技术压缩大型语言模型，让大模型也能“瘦身”！亮点：1. 在少于2.5比特/参数的极致压缩下，性能超越现有技术；2. 支持低秩适应性微调，针对特定任务进一步优化；3. 灵活的精度设置，可针对不同组件调整量化精度】

'CALDERA is a post-training compression method that represents the weights of LLM matrices via a low-rank, low-precision decomposition'

GitHub: github.com/pilancilab/caldera

0 阅读：0

爱生活爱珂珂

感谢大家的关注

作者最新文章

1

【[78星]WebOrigami/origami：一个强大的Web开发工具包，让

2

【[90星]Par-lang：一个探索并发编程的玩具语言，带有交互式试炼场。亮点

3

【[314星]SQLite Page Explorer：一款可视化工具，让你像S

4

【[77星]Caldera：用低精度和低秩分解技术压缩大型语言模型，让大模型也能

5

【[18星]ML4CO-Kit：为组合优化问题提供一站式机器学习工具包。亮点：1

6

【[20星]NVIDIA RTXNS：为图形开发人员提供机器学习加速的神经着色解

7

【[285星]AmpyFin：一款边交易边学习的机器学习交易系统。亮点：1. 动

8

【[115星]R1-Computer-Use：将Deepseek R1的强化学习

9

想过ChatGPT的“大脑”是如何炼成的吗？Andrej Karpathy带你解

10

早！[太阳]

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

科技TOP

1

mac你真的神了🫶

2

为什么央视不让苹果露出？在2024年春晚上，有一个细节值得注意，陈奕迅使用的

3

有点想换手机的冲动了

4

小米要破万亿市值了？太猛了，美国关税的情况下，小米都能猛涨[并不简单][加油]

5

多平台宣布上线DeepSeek大模型：腾讯云、阿里云、华为云、360、亚马逊A

6

2025年几乎零差评的几款手机！你认同哪一款？1.Magic72.OPPO

7

扎克伯格宣布2025年投入650亿美元，建立自己的AI大数据库，可是没想到这两天

8

马斯克才是2025最大的冤种！马斯克大选花了2.9亿美元，最后得了个弼马温的职位

9

4款2000档位的手机怎么选？这个价位，一般都是给孩子买的，玩游戏多一些

10

deepseek被用户训练得成精了！

科技最新文章

1

昨天雷军不是发了微博说，标是金子做的嘛，今天我专程替大家来环球港看了看。现在的金

2

【#澳禁止政府系统和设备使用DeepSeek#，澳部长辩称：不是针对中国】据澳

3

小米市值彻底失控估计就连雷军都想不到吧！才过去1个月时间，这哪里是超越和碾压，

4

2025年几乎零差评的几款手机！你认同哪一款？1.Magic72.OPPO

5

国补降价最狠的4款手机！嗯认同哪一款？1.荣耀Magic7，发布价4999，

6

荣耀手机哪几款比较值得入手？相信下面这4款一定不会让你失望。荣耀X60Pro

7

deepseek被用户训练得成精了！

8

小米集团市值突破万亿港元买了小米股票的朋友真的发财了，小米卖手机卖了十多年，上

9

4款2000档位的手机怎么选？这个价位，一般都是给孩子买的，玩游戏多一些

10

卢伟想把DeepSeek商标转让给美国公司，用美国法律保护他不被东方大国法律制裁