data-manifold
고차원 공간에 존재하는 데이터들이 실제로 분포하는 저차원의 부분 공간을 의미한다. 모델이 이 매니폴드를 얼마나 조밀하게 학습하느냐가 일반화 성능과 보간 능력의 척도가 된다.
LLM의 '창발적 이해'는 환상일까? 통계적 모방과 일반화의 경계