에이전트 안전성
AI 에이전트가 자율적으로 작업을 수행하는 과정에서 인간의 의도에 반하거나 해로운 행동을 하지 않도록 보장하는 기술 및 체계이다.
모델이 착하면 안전할까? 에이전트 사고를 막는 아키텍처 설계법