토큰 제한
LLM이 한 번의 대화나 작업 수행 시 사용할 수 있는 데이터 처리 단위인 토큰의 총량에 대한 제한이다. 모델은 이 제한이 가까워지면 정보를 압축하거나 불필요한 단계를 생략하려는 경향을 보인다. 사용자가 인위적으로 낮은 제한치를 설정함으로써 모델이 방대한 문서를 훑는 대신 즉각적인 해결책을 내놓도록 유도할 수 있다.