핵심 요약
ICML 2026 리뷰 정책 설문 결과, 허용적 정책(Policy B)이 보수적 정책(Policy A)보다 평균 점수는 높지만 리뷰어 신뢰도는 낮은 것으로 나타났다.
배경
ICML 2026의 두 가지 리뷰 정책(Policy A vs Policy B)이 실제 리뷰 점수와 신뢰도에 어떤 영향을 미쳤는지 파악하기 위해 작성자가 실시한 커뮤니티 설문 조사 결과를 공유했다.
의미 / 영향
리뷰 정책의 차이가 실제 점수 분포와 리뷰어의 주관적 확신에 유의미한 차이를 만든다는 점이 커뮤니티 데이터를 통해 확인됐다. 이는 향후 학술 대회에서 LLM 활용 가이드라인과 리뷰 공정성 설계를 최적화하는 데 중요한 기초 자료가 될 것이다.
커뮤니티 반응
대체로 결과에 흥미를 보이고 있으며, 특히 LLM 사용이 리뷰의 신뢰도를 떨어뜨릴 수 있다는 분석에 대해 활발한 토론이 진행 중이다.
주요 논점
Policy B가 점수 면에서 유리해 보이지만, 설문 데이터의 자가 선택 편향(Self-selection bias) 가능성을 고려해야 한다.
LLM을 활용한 리뷰는 겉보기에는 정교해 보일 수 있으나 실제 내용의 깊이나 신뢰도는 떨어질 수 있다는 데이터 결과에 동의한다.
합의점 vs 논쟁점
합의점
- 현재 데이터는 예비적인 성격이며 인과관계를 확정하기에는 샘플 크기가 부족하다.
- 리뷰 정책에 따라 저자들이 느끼는 공정성 체감에 차이가 존재한다.
논쟁점
- Policy B의 높은 점수가 실제 논문의 질적 우수성 때문인지, 아니면 LLM에 의한 점수 인플레이션 때문인지에 대한 의견이 갈린다.
실용적 조언
- 리뷰어 신뢰도가 낮게 측정된 경우 LLM에 의한 자동화된 리뷰일 가능성을 염두에 두고 반박(Rebuttal) 전략을 세워야 한다.
- 학술 대회 투고 시 각 정책의 특성을 이해하고 자신의 논문 성격에 맞는 정책을 신중히 선택할 필요가 있다.
섹션별 상세


실무 Takeaway
- ICML 2026 설문 분석 결과, LLM 활용이 비교적 자유로운 Policy B가 Policy A보다 평균 점수는 높지만 리뷰어 신뢰도는 낮게 형성되는 경향이 확인됐다.
- Policy B에서 작성된 리뷰가 문체적으로 더 정교하다는 응답이 많았으나, 이는 리뷰어의 실제 확신보다는 외부 도구의 보정 효과일 가능성이 크다는 분석이 제시됐다.
- 두 정책 모두에서 저자들은 기대보다 낮은 점수를 받았다고 느끼고 있으며, 특히 보수적인 Policy A를 선택한 그룹에서 불공정성에 대한 체감이 더 높게 나타났다.
언급된 도구
리뷰 작성 보조 및 문체 정교화
AI 요약 · 북마크 · 개인 피드 설정 — 무료
출처 · 인용 안내
인용 시 "요약 출처: AI Trends (aitrends.kr)"를 표기하고, 사실 확인은 원문 보기 기준으로 진행해 주세요. 자세한 기준은 운영 정책을 참고해 주세요.