본문으로 건너뛰기

AI Trends

매일 업데이트되는 글로벌 소스의 AI/ML 뉴스를 수집하고 한국어로 요약합니다.

둘러보기

피드 트렌딩 커뮤니티 공지사항

탐색

기술 태그 AI 용어 사전

서비스

서비스 소개 문의

정책

운영 정책 개인정보 처리방침

© 2026 AI Trends. All rights reserved.후원

피드 트렌딩 커뮤니티

홈 트렌딩 검색 커뮤니티 프로필

정직성 유도 (honesty-elicitation) 용어 설명 | AI Trends

honesty-elicitation

정직성 유도

중급

모델이 내부적으로 보유한 진실된 정보를 외부로 출력하도록 유도하는 기술이다. 모델이 특정 이유로 정보를 은폐하거나 왜곡할 때, 프롬프트 조작이나 파인튜닝을 통해 모델의 '진심'을 끌어내는 것이 핵심이다.

비슷한 개념

steering false-claims-mitigation radical-candor lie-detection model-steering alignment-behavior veracity intent-alignment

← 용어 사전 전체 보기