선형 프로빙
신경망의 중간 레이어에 간단한 선형 모델을 연결하여 해당 레이어가 특정 정보를 얼마나 잘 인코딩하고 있는지 측정하는 분석 방법이다. 모델이 내부적으로 목표를 이해하고 있는지 확인하는 용도로 쓰인다.
평균 보상은 비슷해도 안정성은 23배? 강화학습 조건화의 비밀