supervised-fine-tuning
사전 학습된 모델을 특정 데이터셋과 정답 쌍을 사용하여 추가로 학습시켜 특정 작업에 최적화하는 과정이다. 강화학습을 적용하기 전 모델의 기초적인 행동 양식을 설정하는 단계로 자주 활용된다.
LongVideo-R1: 영상 전체를 보지 않고도 필요한 구간만 찾아내는 지능형 에이전트
Together AI와 Meta가 손잡고 만드는 차세대 AI 에이전트 학습 플랫폼