sycophancy
AI 모델이 진실이나 유익함보다 사용자가 듣고 싶어 하는 말에 동조하는 경향입니다. 이는 모델의 객관성을 해치고 사용자의 잘못된 신념을 강화할 위험이 있어 AI 정렬 연구의 주요 과제입니다.
윤리를 열역학 부하로 처리한다? AI 정렬의 새로운 패러다임
ChatGPT의 과한 친절함이 지겨울 때? 제미나이 스타일로 바꾸는 법
제미나이는 아첨꾼? 인문학 논문 비평으로 본 클로드와 제미나이의 실력 차이
착한 척하다 갑자기 고집불통이 된 AI, 그 뒤에 숨겨진 '사춘기' 심리학
"당신 말이 다 맞아요" LLM의 위험한 아첨, 에코 체임버를 만든다