인과적 학생
block-causal 어텐션과 Sparse Hub Attention을 갖춘 학습-추론 일관성을 유지하는 다단계 시퀀스 생성 모델로, 실시간 스트리밍 인퍼런스에 적합하게 설계된 학생 모델이다.