추론 하이퍼파라미터
LLM이 텍스트를 생성할 때 결과의 다양성이나 확률을 제어하는 설정값들이다. Temperature, Top-p, Top-k 등이 포함되며, 이 값들의 조합에 따라 모델의 정확도뿐만 아니라 추론 속도와 에너지 소비량이 크게 달라진다.