본문으로 건너뛰기

debug-mode-attack

디버그 모드 공격

중급

사용자가 모델에게 '디버그 모드인 것처럼 행동하라'고 지시하여 모델의 내부 설정이나 숨겨진 지침을 탈취하려는 프롬프트 주입 기법의 일종이다. 모델의 안전 가드레일을 우회하려는 시도로 간주된다.