EXL2
ExLlamaV2 전용 포맷으로, 가중치 컬럼별로 다른 비트레이트를 적용하는 가변 양자화를 지원한다. 0.1비트 단위의 정밀 조절이 가능하여 사용자의 VRAM 용량에 맞춰 모델 크기를 최적화할 수 있는 고도의 유연성을 제공한다.