본문으로 건너뛰기

피드 트렌딩 커뮤니티 공지사항 기술 태그 AI 용어 사전 서비스 소개 문의 운영 정책 개인정보 처리방침

매일 업데이트되는 글로벌 소스의 AI/ML 뉴스를 수집하고 한국어로 요약합니다.

AI Trends·후원

피드 트렌딩 커뮤니티 공지

피드 트렌딩 커뮤니티 공지

프리필 공격 (prefill-attack) 용어 설명 | AI Trends

prefill-attack

프리필 공격

중급

LLM이 응답을 생성하기 전, 공격자가 응답의 시작 부분을 특정 문구로 강제 설정하여 모델의 거부 로직을 우회하는 기법이다. 모델이 이미 긍정적인 답변을 시작한 것으로 착각하게 만들어 이후 유해한 내용을 계속 생성하게 유도한다.

비슷한 개념

prompt-injection prefilling pre-fill prefill-vs-decode prefill multi-turn-attack indirect-request prefill-decode-disaggregation

← 용어 사전 전체 보기