ptq

Star

Here are 11 public repositories matching this topic...

Xilinx / brevitas

Star

Brevitas: neural network quantization in PyTorch

fpga deep-learning pytorch neural-networks xilinx quantization hardware-acceleration qat brevitas ptq

Updated May 9, 2024
Python

Bobo-y / flexible-yolov5

Star

More readable and flexible yolov5 with more backbone(gcn, resnet, shufflenet, moblienet, efficientnet, hrnet, swin-transformer, etc) and (cbam，dcn and so on), and tensorrt

sparsity backbone pytorch resnet object-detection gcn tensorrt neck qat shufflenet yolov3 cbam hrnet dcnv2 yolov5 moblienet swin-transformer triton-server ptq

Updated May 8, 2024
Python

Model Compression Toolkit (MCT) is an open source project for neural network model optimization under efficient, constrained hardware. This project provides researchers, developers, and engineers advanced quantization and compression tools for deploying state-of-the-art neural networks.

machine-learning deep-neural-networks deep-learning neural-network tensorflow optimizer pytorch quantization qat network-quantization network-compression edge-ai ptq

Updated May 9, 2024
Python

yester31 / TensorRT_API

Star

Deep Learning Model Optimization Using by TensorRT API, window

cuda pytorch vgg resnet quantization unet tensorrt yolov5 detr ptq yolov6

Updated Aug 29, 2022
Python

yester31 / Quantization_EX

Star

quantization example for pqt & qat

quantization tensorrt int8 qat model-optimization quantization-aware-training post-training-quantization pytorch-quantization ptq

Updated Jul 24, 2023
Python

yester31 / TensorRT_ONNX

Star

Generating tensorrt model using onnx

pytorch quantization tensorrt onnx int8-inference onnxruntime post-training-quantization int8-quantization tensorrt-inference ptq

Updated Jun 22, 2023
C++

BlindOver / blindover_AI

Star

Build AI model to classify beverages for blind individuals

ai deep-learning mobile-app pytorch classification resnet quantization qat shufflenetv2 mobilenetv3 efficientnet ptq

Updated Aug 16, 2023
Python

yester31 / TensorRT_Sparse

Star

inference with the structured sparsity and quantization

quantization tensorrt structured-sparsity sparsity-pattern ptq sparse-tensor-cores sparse-int8-model accelerate-the-inference

Updated Aug 30, 2023
Python

lix19937 / tensorrt-insight

Star

deep insight tensorrt

asp tensorrt qat ptq

Updated May 6, 2024
C++

smpanaro / norm-tweaking

Star

Post post-training-quantization (PTQ) method for improving LLMs. Unofficial implementation of https://arxiv.org/abs/2309.02784

quantization post-training-quantization ptq llms

Updated Feb 21, 2024
Python

OmidGhadami95 / EfficientNetV2_Quantization_CK

Star

EfficientNetV2 (Efficientnetv2-b2) and quantization int8 and fp32 (QAT and PTQ) on CK+ dataset . fine-tuning, augmentation, solving imbalanced dataset, etc.

python tensorflow keras quantization emotion-recognition qat ckplus facial-emotion-recognition scale-down googlecolab efficientnet imbalanced-dataset quantization-aware-training post-training-quantization efficientnetv2 ptq real-time-emotion-classification real-time-emotion-detection efficientnetv2-b2

Updated May 4, 2024
Jupyter Notebook

Improve this page

Add a description, image, and links to the ptq topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the ptq topic, visit your repo's landing page and select "manage topics."

Learn more

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

ptq

Here are 11 public repositories matching this topic...

Xilinx / brevitas

Bobo-y / flexible-yolov5

sony / model_optimization

yester31 / TensorRT_API

yester31 / Quantization_EX

yester31 / TensorRT_ONNX

BlindOver / blindover_AI

yester31 / TensorRT_Sparse

lix19937 / tensorrt-insight

smpanaro / norm-tweaking

OmidGhadami95 / EfficientNetV2_Quantization_CK

Improve this page

Add this topic to your repo