사용자 정렬 비평
AI 에이전트가 수행하려는 각 단계가 사용자의 원래 의도와 일치하는지 독립적인 모델이 검증하는 보안 프로세스이다. 에이전트가 프롬프트 인젝션 공격에 의해 잘못된 방향으로 나아가는 것을 방지한다.
내 브라우저 속 AI 에이전트, 해킹으로부터 안전할까? 구글의 보안 전략