생성 토큰
LLM이 응답을 생성할 때 사용하는 텍스트 단위이다. 생성 토큰 수가 많을수록 더 상세한 답변이 가능하지만 비용과 시간이 증가하며, 추론 모델의 경우 내부 사고 과정에 많은 토큰을 소비하기도 한다.