내부 표현
AI 모델이 외부 데이터를 처리할 때 신경망 내부에서 수치 형태로 저장하고 처리하는 방식이다. 추상적인 개념이 모델 내부에 어떻게 인코딩되어 있는지 나타낸다.
내 AI가 음모론자라면? LLM 속 숨은 인격을 찾아 조종하는 기술