krippendorffs-alpha
여러 평가자가 내린 판단의 일치도를 측정하는 통계적 지표다. 데이터의 유형에 상관없이 사용할 수 있으며, 이 수치가 낮다는 것은 전문가들 사이에서도 품질 평가 기준이 주관적이고 불일치함을 의미한다.
"질문 답변율 12% 상승" Stack Overflow가 LLM을 도입한 구체적 방법