본문으로 건너뛰기
S2N-BIGNUM-BENCH: LLM의 저수준 코드 추론 평가를 위한 실용적 벤치마크 | AI Trends