Half-Quadratic Quantization of large machine learning models

herramientas en línea

herramientas en línea

反馈

herramientas en línea

inicio tema

biblioteca mío

más

Half-Quadratic Quantization of large machine learning models

出处：dropbox.tech

存档：存档

译文：中文

摘要

大模型量化技术迎来新突破！HQQ算法无需校准数据，仅用5分钟即可完成Llama-2-70B的2比特量化，速度超GPTQ 50倍。该技术通过半二次优化和稀疏损失函数处理权重异常值，在保持精度的同时大幅降低内存占用。实测显示，2比特量化的70B模型性能超越全精度13B版本，视觉模型ViT-H-14在2比特下仍优于全精度ViT-B-32。开源代码已发布，推动大模型轻量化部署。

阅读原文

xiaozi 于 2025-10-25 分享

关联话题： #dropbox

欢迎在评论区写下你对这篇文章的看法。

据说喜欢分享的,后来都成了大神

知鸦日报

每日精选

提交句子

路上看到两个长得不好看也看起来很穷的男女热吻。我说两个物质生活质量很差的人，彼此相伴。朋友立刻反驳我：物质生活质量不行就不会幸福吗?他们如此相爱，比那些有钱又美但离婚的名人强多了!我说我根本没说他们不幸福呀，你努力反驳的，可能是你自己内心的声音吧。

Half-Quadratic Quantization of large machine learning models

Half-Quadratic Quantization of large machine learning models

摘要

评论

文库