핵심 요약
Hacker News에서 LLM을 활용한 게시물 작성으로 차단된 개발자가 속죄의 의미로 LLM 생성 댓글 탐지 도구인 HN Bot Detector를 개발했다. 이 도구는 댓글 URL이나 사용자 ID를 입력받아 0점에서 100점 사이의 봇 점수를 산출하며 구체적인 탐지 근거를 함께 제공한다. 특정 문구 패턴, 문장 구조, 유니코드 특수문자 사용 여부 등 다양한 언어적 신호를 분석하여 AI 작성 여부를 판단한다. 사용자는 개별 댓글뿐만 아니라 특정 사용자의 최근 활동이나 게시물 전체의 댓글을 스캔하여 분석 결과를 확인할 수 있다.
배경
TF-IDF, Cosine Similarity, Next.js, Web Heuristics
대상 독자
온라인 커뮤니티 운영자 및 AI 생성 콘텐츠 탐지에 관심 있는 개발자
의미 / 영향
AI 생성 콘텐츠가 커뮤니티 생태계를 위협하는 상황에서 오픈소스 기반의 투명한 탐지 로직은 커뮤니티 신뢰도를 유지하는 데 기여할 수 있다. 특히 단순한 키워드 매칭을 넘어 유니코드와 행동 패턴을 결합한 방식은 향후 텍스트 모더레이션의 중요한 참고 사례가 될 것이다.
섹션별 상세
문구 탐지 및 구조 분석을 통해 봇 여부를 판별한다. TF-IDF 벡터를 활용하여 additionally, furthermore와 같은 전환어나 leverage, delve into 같은 AI 특유의 유행어를 잡아낸다. 축약어 미사용, 150-400단어 사이의 길이, 3문단 구성 등 LLM이 자주 출력하는 전형적인 글쓰기 형태에 가중치를 부여한다. 이러한 언어적 특징들은 사람이 직접 작성할 때보다 AI가 생성할 때 훨씬 높은 빈도로 나타나는 경향이 있다.
유니코드 신호와 리스트 패턴을 주요 지표로 활용한다. 일반 키보드 입력인 직선 따옴표 대신 LLM 출력에서 흔히 보이는 곡선형 유니코드 따옴표나 특수 대시 기호를 추적한다. X, Y, Z와 같이 세 가지 예시를 나열하는 패턴이나 제 경험상과 같은 가짜 개인적 프레임워크 사용 여부도 주요 탐지 근거가 된다. 이러한 미세한 신호들은 텍스트가 외부 도구에서 생성되어 복사되었음을 암시하는 강력한 증거로 작용한다.
사용자 행동 패턴과 의미론적 유사성을 종합적으로 분석한다. 24시간 내 5개 이상의 댓글 작성이나 30분 미만의 평균 작성 간격 등 시간적 데이터를 수집하여 비정상적인 활동을 감지한다. 동일 사용자가 작성한 댓글들 사이의 TF-IDF 코사인 유사도를 계산하여 댓글들이 벡터 공간에서 서로 밀집되어 있는지 확인한다. 댓글 간의 유사도가 0.6을 넘으면 LLM을 사용한 반복적인 콘텐츠 생성으로 간주하여 높은 점수를 부여한다.
기술 스택은 Next.js 14와 TypeScript를 기반으로 하며 Algolia API를 통해 데이터를 연동한다. 기본적으로 제공되는 휴리스틱 분석 외에도 사용자가 API 키를 설정하면 외부 모델을 통한 검증이 가능하다. Anthropic의 Claude Haiku나 OpenAI의 GPT-4o-mini를 연결하여 탐지 결과의 신뢰도를 한층 더 높일 수 있다. 모든 분석 결과는 JSON 형식으로 내보낼 수 있어 대규모 데이터 분석에도 용이하다.
실무 Takeaway
- LLM은 특정 유행어와 정형화된 문단 구조를 갖는 경향이 있어 이를 탐지 지표로 활용 가능하다.
- 텍스트 내 유니코드 특수문자는 외부 도구에서 복사하여 붙여넣은 흔적으로 간주되어 봇 판정의 강력한 근거가 된다.
- 개별 텍스트 분석뿐만 아니라 사용자의 과거 작성 패턴과 댓글 간의 의미론적 유사도를 종합해야 탐지 정확도를 높일 수 있다.
언급된 리소스
AI 분석 전체 내용 보기
AI 요약 · 북마크 · 개인 피드 설정 — 무료