추론 노력
모델이 답변을 생성하기 위해 투입하는 사고의 깊이나 연산 자원의 양을 조절하는 설정이다. 높은 수준으로 설정할수록 모델은 더 복잡한 논리적 단계를 거쳐 정확한 답변을 도출하려 시도한다.
회원가입 없이 즐기는 오픈소스 LLM과 RAG 테스트 플레이그라운드
모델 재로드 없이 Qwen 3.5 사고 모드 즉시 전환하는 방법