문법 제약 디코딩
JSON Schema 등을 FSM으로 컴파일해 각 디코딩 스텝에서 허용 토큰 집합을 마스크하는 방식의 디코딩. 이 방식은 비허용 토큰의 logits를 -∞로 설정해 샘플링에서 배제함으로써 포맷 준수를 강제한다.