소프트 컨텍스트 압축
이산적인 텍스트 토큰을 더 적은 수의 연속적인 벡터(latent tokens)로 변환하여 LLM의 입력 길이를 줄이는 기술이다. 원본 텍스트의 의미 정보를 압축된 벡터에 응축시켜 연산 효율성을 높이는 것이 핵심이다.