1비트 모델
모델의 가중치를 1비트 수준으로 극단적으로 양자화한 형태이다. 모델 크기를 획기적으로 줄이고 연산량을 낮추어 GPU가 없는 일반 사무용 노트북의 CPU에서도 빠른 추론이 가능하게 한다.