잔차 네트워크
입력 데이터를 다음 층으로 직접 전달하는 지름길(Skip Connection)을 추가하여 층이 깊어져도 그래디언트 소실 문제를 완화하는 아키텍처이다. 현대적인 Transformer 구조의 근간이 되며, 본 논문에서는 이 구조에서의 깊이 확장을 집중적으로 다룬다.