self-refinement
모델이 생성한 초기 답변을 스스로 검토하고 피드백을 반영하여 더 정확한 답변으로 반복 수정하는 기법으로, 추론 단계에서 성능을 높이는 핵심 전략이다.
오픈소스 AI의 정점, DeepSeek V3.2의 혁신적 아키텍처와 학습 전략 파헤치기
DeepSeek V3.2의 비밀: MLA와 DSA로 구현한 고효율 추론의 핵심