샘플링 파라미터
LLM이 다음 토큰을 선택할 때 확률 분포를 결정하는 Temperature, Top-P, Top-K 등의 설정값이다. 이 값들을 고정하지 않고 추론 상황에 맞춰 동적으로 변화시키면 모델의 논리적 일관성과 창의성 사이의 균형을 실시간으로 최적화할 수 있다. 모델의 최종 응답 품질을 좌우하는 직접적인 제어 수단이다.