1비트 양자화
모델의 가중치를 단 1비트로 표현하여 메모리 사용량과 모델 크기를 극단적으로 줄이는 기술이다. 기존 4비트나 8비트 양자화보다 훨씬 작은 리소스로 실행 가능하며, Bonsai 모델의 경우 일반 모델 대비 약 14배의 경량화를 달성했다.