토큰 분포 형태
입력과 출력으로 분포된 토큰의 길이와 비율을 가리키며, 청구 비용은 입력 토큰과 출력 토큰을 각각 합산해 계산되므로 출력 중심의 길이 편향이 비용을 크게 증폭시킨다. 이 개념은 평균 응답 길이, 청킹 전략, 재시도 빈도와 결합해 실제 비용 구조를 결정하므로 비용 모델링 시 핵심 변수로 취급된다.