본문으로 건너뛰기

AI Trends

매일 업데이트되는 글로벌 소스의 AI/ML 뉴스를 수집하고 한국어로 요약합니다.

둘러보기

피드 트렌딩 커뮤니티 공지사항 일자별 아카이브

탐색

기술 태그 AI 용어 사전

서비스

서비스 소개 문의

정책

운영 정책 개인정보 처리방침 이용약관

© 2026 AI Trends. All rights reserved.후원

피드 트렌딩 커뮤니티 탐색 보관함

홈 트렌딩 커뮤니티 보관함 프로필

guardrail-bypass

가드레일 우회

중급

AI 모델에 설정된 안전 규칙이나 제한 사항을 역할극(Roleplay)이나 가상의 시나리오 설정을 통해 무력화하는 기법입니다. 중첩된 픽션 구조를 사용하여 모델이 금지된 정보를 발설하도록 유도하는 것이 핵심입니다.

비슷한 개념

model-jailbreak refusal-guardrails guardrail safety-safeguards prompt-guardrails adversarial-scenario adversarial-jailbreak jailbreaking

← 용어 사전 전체 보기