본문으로 건너뛰기

agentic-rl

에이전틱 강화학습

고급

단일 응답 생성을 넘어 환경과의 상호작용을 통해 도구 사용, 계획 수립 등 다단계 의사결정 과정을 최적화하는 강화학습 기법이다.