how to do Post-training integer quantization with int16 activation #279

FengWu-PKU · 2024-01-29T03:21:07Z

模型在int8 PTQ后精度下降很多，请问现在支持int16 activation吗，谢谢

FengWu-PKU · 2024-01-29T03:21:47Z

以及钉钉群的二维码过期吗，能否麻烦更新一下

peterjc123 · 2024-01-29T06:55:54Z

以及钉钉群的二维码过期吗，能否麻烦更新一下

二维码已经更新了

peterjc123 · 2024-01-30T06:45:41Z

模型在int8 PTQ后精度下降很多，请问现在支持int16 activation吗，谢谢

Int16量化我们是支持的（详见 #47 ），但是一般来说后端的实现还不太成熟，可能导致模型推理要比int8慢很多，一般来说还是建议进一步分析是哪些层导致量化的损失，然后在转换时跳过这些层的量化。

FengWu-PKU · 2024-01-30T07:41:12Z

好的，十分感谢

peterjc123 added the question Further information is requested label Jan 29, 2024

peterjc123 closed this as completed May 29, 2024

Provide feedback