3-SAT 문제
논리식의 만족 가능성을 판별하는 컴퓨터 과학의 고전적인 난제이다. LLM이 단순한 패턴 암기가 아닌 실제적인 논리적 추론 능력을 갖추었는지 평가하는 벤치마크로 자주 활용된다.