N-그램 모델
텍스트에서 n개의 연속된 단어나 토큰의 시퀀스를 분석하여 다음 토큰이 나타날 확률을 예측하는 통계적 언어 모델이다. 이 아티클에서는 4-그램 모델을 사용하여 코드의 문법적 패턴을 학습하고 이를 압축을 위한 확률 추정에 활용했다.