본문으로 건너뛰기
Bullshit Benchmark: 모델이 말도 안 되는 질문을 얼마나 잘 걸러내는가 | AI Trends