서브쿼드라틱 어텐션
입력 길이가 늘어남에 따라 연산량이 제곱으로 늘어나는 기존 Transformer의 한계를 극복한 아키텍처이다. 이를 통해 긴 문맥에서도 연산 효율성을 유지하며 속도를 높인다.