수직 어텐션
각 레이어가 이전 레이어의 상태를 직접 쿼리하여 레이어 간 메모리 상호작용을 가능하게 하는 기법이다. 기존 Transformer의 수평적 시퀀스 상호작용을 레이어 깊이 방향으로 확장하여 추론 지연 시간 증가 없이 모델의 표현력을 높인다.