분홍 코끼리 효과
특정 행동을 하지 말라고 지시할수록 오히려 해당 개념이 프롬프트 내에서 활성화되어 모델이 그 행동을 수행할 확률이 높아지는 현상이다. 부정어 사용이 의도치 않게 해당 토큰에 대한 주의도를 높이기 때문에 발생한다.