어텐션 싱크
소프트맥스 계산 시 가상의 토큰 역할을 하는 학습 가능한 파라미터로, 어텐션 가중치가 특정 토큰에 과도하게 쏠리는 것을 방지하여 긴 문맥에서도 모델의 안정성을 유지한다.
GPT-OSS의 성능을 극대화하는 에이전틱 RL 학습 최적화 가이드