디코드 길이
LLM이 생성하는 출력 토큰의 총 개수를 의미한다. 응답마다 이 길이가 다르면 동기식 처리 환경에서 자원 낭비가 발생하며, 비동기 처리를 통해 이를 최적화하는 것이 중요하다.