When llava-v1.6 models w8a8_int8 quantization can be supported? #990

wuyu1028 · 2024-12-18T07:18:54Z

any plan for llava-v1.6 models be supported by w8a8_int8 ?

kylesayrs · 2024-12-28T17:18:15Z

You can check out the llm-compressor kylesayrs/gptq-partition branch and the compressed-tensors main branch. These changes will allow you to quantize multimodal vision models and have been tested with llava-1.5-7b-hf.

These changes will be made available with the next llm-compressor release.

wuyu1028 added the enhancement New feature or request label Dec 18, 2024

kylesayrs self-assigned this Dec 29, 2024

kylesayrs mentioned this issue Dec 29, 2024

VLM Support via GPTQ Hooks and Data Pipelines #914

Merged

dsikka closed this as completed in #914 Jan 8, 2025

dsikka closed this as completed in 03e2177 Jan 8, 2025

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

When llava-v1.6 models w8a8_int8 quantization can be supported? #990

When llava-v1.6 models w8a8_int8 quantization can be supported? #990

wuyu1028 commented Dec 18, 2024

kylesayrs commented Dec 28, 2024

When llava-v1.6 models w8a8_int8 quantization can be supported? #990

When llava-v1.6 models w8a8_int8 quantization can be supported? #990

Comments

wuyu1028 commented Dec 18, 2024

kylesayrs commented Dec 28, 2024