지시어 튜닝
모델이 사용자의 특정 명령이나 질문에 적절히 응답하도록 미세 조정하는 과정이다. 단순한 텍스트 완성을 넘어 대화형 에이전트로서의 성능을 확보하기 위한 필수 단계이다.
LLM 파인튜닝 성능 극대화하는 인스트럭션 선택의 기술
재학습 없이 모델을 키운다? 1B 모델의 파라미터 확장 실험