美团开源首发INT8满血版DeepSeek R1!老显卡也能用

美团搜推机器学习团队 3 月 4 日公布最新首发开源成果,实现对 DeepSeek R1 模型基本无损的 INT8 精度量化。

美团开源首发INT8满血版DeepSeek R1!老显卡也能用

游民星空

下载游民App,掌握一手游戏情报

美团开源首发INT8满血版DeepSeek R1!老显卡也能用

IT之家 汪淼 2025-03-07 21:05
0

IT之家 3 月 7 日消息,美团搜推机器学习团队 3 月 4 日公布最新首发开源成果,实现对 DeepSeek R1 模型基本无损的 INT8 精度量化。

游民星空

DeepSeek R1 原生版本的模型权重为 FP8 数据格式,对 GPU 芯片类型有严格限制,仅能被英伟达新型 GPU 支持(如 Ada、Hopper 架构芯片),其他型号 GPU(如 A100)无法直接部署。

游民星空

目前,量化代码已经合入到了开源 LLM 推理框架 SGLang,量化模型已经发布到了 Hugging Face 社区,方便用户使用。官方测试,满血版 DeepSeek R1 部署 A100,基于 INT8 量化,相比 BF16 实现 50% 吞吐提升。

开源地址链接>>

责任编辑:猛鲨男鱼王

APP精彩推荐打开游民APP查看更多

相关内容 打开游民APP查看更多

在线玩推荐更多