linear-quantization

Star

Here are 3 public repositories matching this topic...

creaitr / Linear-Quantization

Star

Implementation of Linear Quantization for Deep Neural Networks on Tensorflow

tensorflow cnn linear-quantization

Updated Nov 8, 2019
Python

ksm26 / Quantization-Fundamentals-with-Hugging-Face

Star

Learn linear quantization techniques using the Quanto library and downcasting methods with the Transformers library to compress and optimize generative AI models effectively.

compression optimize quantization model-compression model-deployment linear-quantization transformers-library model-optimization hugging-face generative-ai downcasting quanto-library quantization-fundamentals

Updated Apr 23, 2024
Jupyter Notebook

Dive into advanced quantization techniques. Learn to implement and customize linear quantization functions, measure quantization error, and compress model weights using PyTorch for efficient and accessible AI models.

machine-learning quantization model-compression linear-quantization quantization-error ai-optimization advanced-quantization symmetric-quantization asymmetric-quantization per-tensor-granularity per-channel-granularity per-group-granularity pytorch-quantizer weight-packing 8-bit-compression 2-bit-weights

Updated May 22, 2024
Jupyter Notebook

Improve this page

Add a description, image, and links to the linear-quantization topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the linear-quantization topic, visit your repo's landing page and select "manage topics."

Learn more

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

linear-quantization

Here are 3 public repositories matching this topic...

creaitr / Linear-Quantization

ksm26 / Quantization-Fundamentals-with-Hugging-Face

ksm26 / Quantization-in-Depth

Improve this page

Add this topic to your repo