가드레일 우회
AI 모델에 설정된 안전 규칙이나 제한 사항을 역할극(Roleplay)이나 가상의 시나리오 설정을 통해 무력화하는 기법입니다. 중첩된 픽션 구조를 사용하여 모델이 금지된 정보를 발설하도록 유도하는 것이 핵심입니다.