토큰 단위 속성 부여
LLM이 생성한 특정 단어나 문장이 학습 데이터의 어떤 구체적인 지점에서 기인했는지 추적하여 연결하는 기술이다. 모델이 생성한 오정보나 유해 콘텐츠의 근원을 파악하여 데이터셋을 정제하는 데 필수적인 역할을 한다.