트랜스포머 대량 편집 메모리
트랜스포머 모델의 다층 퍼셉트론(MLP) 가중치를 직접 수정하여 특정 지식을 주입하는 기술이다. 별도의 재학습 없이 단일 연산으로 모델의 지식을 업데이트할 수 있어 실시간 정보 반영에 유리하다.
RAG 없이 모델 가중치에 직접 지식을 주입하는 'Sleeping LLM'