탐색과 활용의 균형(exploration-exploitation-trade-off)이란 무엇인가요?

Question

Accepted Answer

새로운 정보를 얻기 위해 미지의 영역을 시도하는 탐색과 이미 알고 있는 최선의 정보를 활용하는 것 사이의 균형을 맞추는 문제입니다. 강화학습 에이전트가 최적의 성과를 내기 위해 반드시 해결해야 하는 핵심 과제입니다.

exploration-exploitation-trade-off