Plan 모드에서 스킬 활성화 시 사용자 확인 절차를 추가하고 CPU 성능 테스트 하네스 및 평가 인프라를 개선했습니다.
Plan 모드 사용자 확인 강화
Plan 모드에서 activate_skill 기능을 실행할 때 사용자의 명시적인 확인을 요구하도록 변경되었습니다.
CPU 성능 테스트 하네스 추가
CPU 성능 통합 테스트를 위한 전용 하네스가 추가되어 성능 측정이 용이해졌습니다.
평가 인프라 일반화
다양한 유형의 평가와 명명된 스위트의 큐잉 및 조직화를 지원하도록 평가 인프라를 확장했습니다.
아직 관련 토론이 없습니다.
댓글을 작성하려면 로그인이 필요합니다.