컨텍스트 길이
모델이 한 번에 기억하고 처리할 수 있는 토큰의 최대량이다. 길이가 길어질수록 더 많은 정보를 참조할 수 있지만 VRAM 소모량이 급증한다.
내 노트북에서 LLM 돌리기: Ollama와 LM Studio 완벽 가이드