메모리 압축
대화 내용이 길어질 때 핵심 내용을 요약하여 토큰 사용량을 줄이고 중요한 맥락만 유지하여 효율적인 추론을 가능하게 하는 기법이다.
계획부터 검증까지: 나만의 자율형 AI 에이전트 프레임워크 만들기