self-forcing
모델이 직접 생성한 출력을 다시 입력으로 사용하는 실제 추론 환경과 유사한 방식으로 학습시켜, 장기 생성 시 발생하는 오차 누적 문제를 완화하는 기법이다.
마인크래프트에서 1,264만 프레임으로 학습한 멀티플레이어 월드 모델 솔라리스
텍스트와 마우스로 조종하는 실시간 게임 세상, Waypoint-1 공개