为破解大模型部署与推理成本高昂的困境,北京大学杨仝老师团队首次提出名为iFairy的超低比特量化方案。该方案创新性地利用复数{±1, ±i}对模型权重进行2-bit量化,在实现1/8极致压缩与“无乘法”推理加速的同时,语言建模能力和下游任务表现甚至反超了其全精度的LLaMA基座模型。

免责声明:该文章旨在为读者提供更多新闻资讯,所涉内容不构成投资、消费建议,仅供读者参考。
【责任编辑:陈秋静】
COMPO
WS68a58db6a3104ba1353fddff
https://cnews.chinadaily.com.cn/a/202508/20/WS68a58db6a3104ba1353fddff.html