재귀적 긴 문맥 추론
긴 문맥을 처리할 때 정보를 재귀적으로 참조하며 추론하는 작업 방식이다. 대규모 모델 대신 효율적인 하드웨어에서 수행할 경우 비용과 지연 시간을 크게 줄일 수 있다.