본문으로 건너뛰기
DeepSeek-Overclock 프로젝트와 Qwen 팀의 연구가 밝힌 GPQA 및 HLE 벤치마크 데이터의 심각한 결함 | AI Trends