테스트 시점 학습
모델이 추론(테스트) 단계에서 입력 데이터에 맞춰 가중치를 실시간으로 업데이트하는 기법으로, 데이터의 특성에 동적으로 적응하는 능력을 제공하며 시퀀스 모델링의 유연성을 극대화하고 긴 문맥 처리 성능을 높인다.
테스트 시점 학습(TTT)의 비밀: 알고 보니 고성능 선형 어텐션이었다