고속 월시-아다마르 변환
데이터의 에너지를 고르게 분산시키는 수학적 변환 기법으로, 양자화 과정에서 특정 채널에 정보가 쏠리는 현상을 방지한다. LLM의 어텐션 헤드 구조에서 이상치(Outlier)의 영향을 줄여 양자화 정확도를 높이는 데 사용된다.