TL;DR
대규모 대화 트랜스크립트를 대상으로 LLM 주도 특징 발견을 시도했다. 트랜스크립트를 사용자 발화, 생각, 응답으로 분리하고 각 조각의 특징을 자동 생성한 뒤 임베딩하고 클러스터링한 다음 클러스터를 요약한다. EDW와의 유사성·차이점을 비교하며, 실험적으로 100k 트랜스크립트에서 20k 특징을 생성하고, 많은 클러스터가 Gemini의 흥미로운 행동을 포착하지만 생각/응답의 예측은 로지스틱 회귀로도 완전히 설명되진 않는다는 점을 보인다. 이 방법은 모델 내부에 접근하지 않고도 행동 양상을 분석할 수 있게 해주지만, 모델 인퍼런스 내부를 제어하는 데에는 한계가 있다.
섹션별 상세
이미지 분석

트랜스크립트를 사용자 발화/생각/응답으로 분리하고, 임베딩-클러스터링-레이블링으로 특징을 도출하는 파이프라인의 흐름을 시각적으로 제시한다.
LLM-Driven Feature Discovery 흐름을 보여주는 다이어그램

고정된 x축(Test F1)에서 Thought와 Response의 개별 카테고리별 빈도를 시각화해, 어떤 클러스터가 예측에 유의미한지 시사한다.
Thought/Response의 예측 성능 분포를 나타내는 차트
실무 Takeaway
- 대화 트랜스크립트의 각 구성요소를 자동으로 특징화하면 모델 행동의 패턴을 빠르게 포착할 수 있다
- 임베딩-클러스터링-레이블링의 간결한 파이프라인은 외부 관찰만으로도 의미 있는 주제를 도출할 수 있게 한다
- 클러스터의 예측 가능성은 특정 경우에 한정되며, API 참조 기반 특성처럼 명시적 신호가 강한 부분에서 더 잘 드러난다
- EDW와의 비교에서 각 방식의 강점이 다르므로 목적에 따라 적합한 방법을 선택해야 한다
- 향후 연구는 내부 모델 정보 의존도와 해석 가능성의 균형을 어떻게 달성할지에 중점을 둘 필요가 있다
AI 요약 · 북마크 · 개인 피드 설정 — 무료
출처 · 인용 안내
인용 시 "요약 출처: AI Trends (aitrends.kr)"를 표기하고, 사실 확인은 원문 보기 기준으로 진행해 주세요. 자세한 기준은 운영 정책을 참고해 주세요.