추론 설정
모델이 답변을 생성할 때 적용되는 Temperature, Top P 등의 파라미터 집합이다. 이 수치들을 조정함으로써 모델 출력의 창의성이나 일관성을 제어하고 시스템 자원 활용도를 최적화할 수 있다.