Quantize export in Python #651

yeliang2258 · 2022-03-25T09:59:10Z

支持Paddle量化模型导出

如果你导出的ONNX模型用TensorRT进行部署，TensorRT可直接加载该模型做量化推理

paddle2onnx --model_dir quant_inference_model/ --model_filename model.pdmodel --params_filename model.pdiparams --save_file model.onnx --opset_version 13 --enable_onnx_checker True --deploy_backend TensorRT

如果你导出的ONNX模型用ONNXRuntime进行部署,ONNXRuntime可直接加载该模型做量化推理

paddle2onnx --model_dir quant_inference_model/ --model_filename model.pdmodel --params_filename model.pdiparams --save_file model.onnx --opset_version 13 --enable_onnx_checker True --deploy_backend ONNXRuntime

如果你导出的ONNX模型用其他推理引擎部署，将会导出float模型和量化表，量化表是内容：{tensor_name: scale_list, zero_list }

paddle2onnx --model_dir quant_inference_model/ --model_filename model.pdmodel --params_filename model.pdiparams --save_file model.onnx --opset_version 13 --enable_onnx_checker True --deploy_backend Others

…ONNX into quantize_dev

simplify code

jiangjiajun · 2022-04-26T02:43:14Z

paddle2onnx/graph/onnx_graph.py

+            if node.type in ["dequantize_linear", "quantize_linear"]:
+                return "new_type"
+            # If the next op of conv or matmul is a dequantize OP, it is a static type
+            if node.type.count("conv") or node.type.count("matmul"):


为什么需要是op为conv/matmul，且下一个OP的名字中包含dequantize或quantize_dequantize，才为static。直接判断模型中的OP是否存在dequantize或quantize_dequantize，会有什么问题

yeliang2258 and others added 30 commits November 10, 2021 13:54

first commit for quantize

f9af046

add quanti op

4904683

update code for quantize

2c6acb0

Merge branch 'develop' into quantize_dev

43920cd

update code to remove useless code

018d3a3

remove useless info

1e0f125

Merge branch 'develop' into quantize_dev

cdc7ca4

Merge branch 'develop' into quantize_dev

d7c02b4

Merge remote-tracking branch 'upstream/develop' into quantize_dev

2188106

add four new q and dq support

c566a12

Merge remote-tracking branch 'upstream/develop' into quantize_dev

f007320

add remove_isolated_node_pass

3a401e9

fix

8e76135

Merge branch 'develop' into quantize_dev

eb60dc6

Merge branch 'develop' into quantize_dev

9207a6f

Merge remote-tracking branch 'upstream/develop' into quantize_dev

e05a76a

update code

a30b3f9

Merge branch 'quantize_dev' of https://github.com/yeliang2258/Paddle2…

efbcecd

…ONNX into quantize_dev

Merge remote-tracking branch 'upstream/develop' into quantize_dev

c406017

Merge remote-tracking branch 'upstream/develop' into quantize_dev

255d607

fix split

91f2417

Merge branch 'develop' into quantize_dev

af1097e

Merge remote-tracking branch 'upstream/develop' into quantize_dev

bf8fb20

Merge branch 'quantize_dev' of https://github.com/yeliang2258/Paddle2…

c536a5d

…ONNX into quantize_dev

fix

90a7fc4

Merge branch 'develop' into quantize_dev

86162e1

re-ci

22a591a

Merge branch 'quantize_dev' of https://github.com/yeliang2258/Paddle2…

92586d5

…ONNX into quantize_dev

Merge branch 'develop' into quantize_dev

7475349

update

ec42014

yeliang2258 mentioned this pull request Apr 24, 2022

0.9.5版本，量化算子仍不支持fake_channel_wise_dequantize_max_abs, fake_quantize_range_abs_max #712

Closed

yeliang2258 and others added 6 commits April 24, 2022 02:46

fix onnxruntime matmul export

671a0db

Merge pull request #4 from yeliang2258/fix_quantize_3_dev

f68a64f

simplify code

fix bug

e0a9bb5

fix quant_axis in conv

2d239a6

fix quantize_axis set

8606eba

add clip op

13217cd

jiangjiajun requested changes Apr 26, 2022

View reviewed changes

jiangjiajun and others added 7 commits April 26, 2022 19:49

Merge branch 'develop' into new_quantize_dev

cb393c9

remove useless clips

bc17cfa

update quantize helper

493ffc7

Merge remote-tracking branch 'upstream/develop' into new_quantize_dev

ee4ac6f

Merge remote-tracking branch 'upstream/develop' into new_quantize_dev

e66f8a6

update code

130e36c

Merge remote-tracking branch 'upstream/develop' into new_quantize_dev

d502ccf

yeliang2258 requested a review from jiangjiajun May 25, 2022 03:23

yeliang2258 and others added 8 commits May 25, 2022 06:07

Merge remote-tracking branch 'upstream/develop' into new_quantize_dev

4687255

fix

bd055a5

Merge remote-tracking branch 'upstream/develop' into new_quantize_dev

fa36a77

fix bugs

4f09bfd

update code, fix bug

96be5f5

Merge remote-tracking branch 'upstream/develop' into new_quantize_dev

c279986

fix bug

2630099

Merge branch 'develop' into new_quantize_dev

8c38ee4

yeliang2258 mentioned this pull request Jun 29, 2022

int8量化后的模型导出onnx时，有两个op不支持 #402

Open

yeliang2258 added 2 commits July 15, 2022 17:30

Merge branch 'develop' into new_quantize_dev

712f42b

Merge branch 'develop' into new_quantize_dev

89b681b

yeliang2258 changed the title ~~New quantize dev~~ Python quantize export Aug 9, 2022

yeliang2258 changed the title ~~Python quantize export~~ Quantize export in Python Aug 9, 2022

Zheng-Bicheng closed this May 22, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Quantize export in Python #651

Quantize export in Python #651

yeliang2258 commented Mar 25, 2022 •

edited

jiangjiajun Apr 26, 2022

Quantize export in Python #651

Quantize export in Python #651

Conversation

yeliang2258 commented Mar 25, 2022 • edited

jiangjiajun Apr 26, 2022

Choose a reason for hiding this comment

yeliang2258 commented Mar 25, 2022 •

edited