패딩 인식
가변 길이 데이터에서 실제 유효한 데이터가 아닌 빈 공간(패딩)을 연산 과정에서 지능적으로 제외하는 방식이다. 불필요한 패딩 토큰에 대한 연산을 건너뜀으로써 계산 자원 낭비를 줄이고 전체적인 추론 및 학습 속도를 최적화한다.