정보 보안 경진 대회
참가자들이 시스템의 취약점을 찾아 '플래그'라는 특정 문자열을 획득하는 보안 경쟁 대회이다. LLM의 논리적 추론과 코드 분석 능력을 테스트하기에 적합한 벤치마크 환경을 제공한다.
LLM 에이전트로 CTF 19개 문제 해결: xAI, Gemini, Anthropic 비교