모델 스티어링
AI 모델이 생성하는 답변의 톤, 편향, 인격 등을 특정 방향으로 유도하거나 조종하는 기술이다. 모델 내부의 특정 표현력을 강화하거나 약화시켜 원하는 결과를 얻는다.
내 AI가 음모론자라면? LLM 속 숨은 인격을 찾아 조종하는 기술