정직성 유도
모델이 내부적으로 보유한 진실된 정보를 외부로 출력하도록 유도하는 기술이다. 모델이 특정 이유로 정보를 은폐하거나 왜곡할 때, 프롬프트 조작이나 파인튜닝을 통해 모델의 '진심'을 끌어내는 것이 핵심이다.