순환 신경망
입력 데이터를 순차적으로 처리하며 이전 단계의 정보를 현재 단계의 입력과 함께 연산하는 구조로 시계열 데이터 처리에 강점이 있으나 병렬 처리에 제약이 있을 수 있다.
Qwen 비전 모델의 RNN 특성, 컨텍스트 초과 시 성능 저하 유발