본문으로 건너뛰기

exploration-exploitation-trade-off

탐색과 활용의 균형

입문

새로운 정보를 얻기 위해 미지의 영역을 시도하는 탐색과 이미 알고 있는 최선의 정보를 활용하는 것 사이의 균형을 맞추는 문제입니다. 강화학습 에이전트가 최적의 성과를 내기 위해 반드시 해결해야 하는 핵심 과제입니다.