모델 기반 강화학습
에이전트가 환경의 작동 방식을 예측하는 내부 모델을 학습하고 이를 바탕으로 계획을 세우는 방식이다. 단순 시행착오보다 효율적이지만, 잘못된 모델 학습 시 예기치 못한 위험을 초래할 수 있다.
LLM은 안전하지만 AGI는 다르다? AI 안전 전문가의 경고