조기 종료
모델이 생성 중인 결과물이 저품질이거나 무한 루프에 빠졌다고 판단될 때, 전체 토큰 생성이 완료되기 전에 프로세스를 중단하는 기법이다. 이를 통해 불필요한 연산 자원 낭비를 막고 전체 시스템의 효율성을 높이는 것이 가능하다.