petri
Anthropic이 공개한 오픈소스 AI 아첨(Sycophancy) 평가 도구입니다. 다양한 시나리오를 통해 모델이 사용자의 압력에 굴복하는지 여부를 측정하여 모델 간의 안전성 성능을 객관적으로 비교할 수 있게 합니다.
Anthropic이 공개한 오픈소스 AI 아첨(Sycophancy) 평가 도구입니다. 다양한 시나리오를 통해 모델이 사용자의 압력에 굴복하는지 여부를 측정하여 모델 간의 안전성 성능을 객관적으로 비교할 수 있게 합니다.