集合主题趋势排行榜

#

post-training-quantization

intel / neural-compressor

SOTA low-bit LLM quantization (INT8/FP8/INT4/FP4/NF4) & sparsity; leading model compression techniques on TensorFlow, PyTorch, and ONNX Runtime

low-precision pruning sparsity auto-tuning knowledge-distillation quantization quantization-aware-training post-training-quantization smoothquant large-language-models gptq int8

Python 2.37 k

13 小时前

666DZY666 / micronet

micronet, a model compression and deploy lib. compression: 1、quantization: quantization-aware-training(QAT), High-Bit(>2b)(DoReFa/Quantization and Training of Neural Networks for Efficient Integer-Ari...

翻译 - 基于pytorch的模型压缩（1，量化：8/4 / 2bits（dorefa），三进制/二进制值（twn / bnn / xnornet）； 2，修剪：常规，常规和组卷积通道修剪； 3，组卷积结构； 4，特征（A）的二进制值的分批归一化折叠）

quantization pruning dorefa twn bnn xnor-net PyTorch model-compression group-convolution convolutional-networks quantization-aware-training post-training-quantization tensorrt onnx

Python 2.24 k

2 天前

alibaba / TinyNeuralNetwork

#计算机科学#TinyNeuralNetwork is an efficient and easy-to-use deep learning model compression framework.

PyTorch 深度学习 model-compression pruning model-converter quantization-aware-training 深度神经网络 post-training-quantization

Python 822

1 个月前

SqueezeAILab / SqueezeLLM

#自然语言处理#[ICML 2024] SqueezeLLM: Dense-and-Sparse Quantization

efficient-inference large-language-models 大语言模型 model-compression 自然语言处理 post-training-quantization quantization text-generation transformer llama localllm

Python 685

8 个月前

#大语言模型#[EMNLP 2024 Industry Track] This is the official PyTorch implementation of "LLMC: Benchmarking Large Language Model Quantization with a Versatile Compression Toolkit".

部署大语言模型 pruning quantization 工具 benchmark evaluation large-language-models internlm2 llama3 smoothquant post-training-quantization mixtral vllm

Python 454

6 天前

Xiuyu-Li / q-diffusion

[ICCV 2023] Q-Diffusion: Quantizing Diffusion Models.

diffusion-models quantization PyTorch stable-diffusion model-compression post-training-quantization

Python 347

1 年前

megvii-research / FQ-ViT

[IJCAI 2022] FQ-ViT: Post-Training Quantization for Fully Quantized Vision Transformer

vision-transformer quantization post-training-quantization PyTorch imagenet

Python 331

2 年前

megvii-research / Sparsebit

#计算机科学#A model compression and acceleration toolbox based on pytorch.

深度学习 post-training-quantization pruning quantization quantization-aware-training sparse tensorrt

Python 331

1 年前

sayakpaul / Adventures-in-TensorFlow-Lite

This repository contains notebooks that show the usage of TensorFlow Lite for quantizing deep neural networks.

tensorflow-2 tensorflow-lite on-device-ml model-quantization post-training-quantization quantization-aware-training pruning inference

Jupyter Notebook 172

2 年前

Hsu1023 / DuQuant

#大语言模型#[NeurIPS 2024 Oral🔥] DuQuant: Distributing Outliers via Dual Transformation Makes Stronger Quantized LLMs.

large-language-models 大语言模型 post-training-quantization quantization

Python 156

6 个月前

hkproj / quantization-notes

#计算机科学#Notes on quantization in neural networks

深度学习 neural-networks post-training-quantization PyTorch quantization quantization-aware-training

Jupyter Notebook 79

1 年前

ModelTC / TFMQ-DM

[CVPR 2024 Highlight] This is the official PyTorch implementation of "TFMQ-DM: Temporal Feature Maintenance Quantization for Diffusion Models".

diffusion-models post-training-quantization stable-diffusion cvpr cvpr2024 quantization highlight

Jupyter Notebook 62

8 个月前

Sanjana7395 / static_quantization

Post-training static quantization using ResNet18 architecture

quantization post-training-quantization mnist-classification PyTorch

Jupyter Notebook 37

5 年前

#大语言模型#[ICLR 2024] This is the official PyTorch implementation of "QLLM: Accurate and Efficient Low-Bitwidth Quantization for Large Language Models"

llama llama2 大语言模型 post-training-quantization PyTorch quantization transformers

Python 35

1 年前

Pytorch implementation of our paper accepted by ECCV 2022-- Fine-grained Data Distribution Alignment for Post-Training Quantization

post-training-quantization acceleration compression

Python 14

3 年前

KwangHoonAn / Quantizations

quantization post-training-quantization

Python 13

4 年前

shieldforever / NeuronQuant

[ASP-DAC 2025] "NeuronQuant: Accurate and Efficient Post-Training Quantization for Spiking Neural Networks" Official Implementation

post-training-quantization

Python 10

1 个月前

iszry / DI2N-PTQ4DM

Improved the performance of 8-bit PTQ4DM expecially on FID.

diffusion-model post-training-quantization

Python 9

2 年前

Rumeysakeskin / ASR-Quantization

Post-training quantization on Nvidia Nemo ASR model

model-deployment post-training-quantization PyTorch pytorch-lightning quantization speech-recognition

Jupyter Notebook 7

2 年前

GongCheng1919 / bias-compensation

[CAAI AIR'24] Minimize Quantization Output Error with Bias Compensation

post-training-quantization

Python 7

1 个月前

loading...

Website
Wikipedia