token-theft
토큰 탈취
프롬프트 내에서 특정 단어나 개념이 모델의 주의력을 과도하게 점유하여 의도하지 않은 방향으로 출력을 유도하는 현상이다. 이 글에서는 '순수성(Purity)' 메타포가 모델의 논리를 오염시키는 버그를 해결하려는 맥락에서 사용되었다.
토큰 탈취
프롬프트 내에서 특정 단어나 개념이 모델의 주의력을 과도하게 점유하여 의도하지 않은 방향으로 출력을 유도하는 현상이다. 이 글에서는 '순수성(Purity)' 메타포가 모델의 논리를 오염시키는 버그를 해결하려는 맥락에서 사용되었다.