MIT HAN Lab

streaming-llm Public

[ICLR 2024] Efficient Streaming Language Models with Attention Sinks

Python 6.2k 349

smoothquant Public

[ICML 2023] SmoothQuant: Accurate and Efficient Post-Training Quantization for Large Language Models

Python 1k 110

llm-awq Public

AWQ: Activation-aware Weight Quantization for LLM Compression and Acceleration

Python 1.8k 125

bevfusion Public

[ICRA'23] BEVFusion: Multi-Task Multi-Sensor Fusion with Unified Bird's-Eye View Representation

Python 2k 364

once-for-all Public

[ICLR 2020] Once for All: Train One Network and Specialize it for Efficient Deployment

Python 1.8k 332

temporal-shift-module Public

[ICCV 2019] TSM: Temporal Shift Module for Efficient Video Understanding

Python 2k 417

Provide feedback