4비트 양자화
모델의 가중치를 4비트 정밀도로 압축하여 메모리 사용량을 줄이는 기법이다. Phosphene은 이를 통해 수십 기가바이트에 달하는 LTX 2.3 모델을 일반 사용자용 Mac의 RAM 환경에서도 실행 가능하도록 최적화한다.