AI 논문 한국어 요약

HF Daily Papers Training OptimizationNEW7시간 전· 4일 전 발행

GiGPO에서 Muon 적용으로 최종 검증 성공률 88% 향상

GiGPO 환경에서 Muon을 정책의 숨겨진 행렬 파라미터에 적용하자 최종 윈도우 검증 성공률이 평균 0.29에서 0.55로 증가했고 학습 효율도 개선됐다.

GiGPO Muon

HF Daily Papers OptimizationNEW7시간 전· 4일 전 발행

RHI로 사용자 하니스의 실행 추적 품질과 비용 효율성 개선

하니스를 프롬프트 수준으로 표현하고 쌍별 피드백으로 반복 개정하는 RHI가 소수 반복으로 실행 추적 품질을 높여 저추론비용 에이전트의 성능을 끌어올리고 추론 비용을 최대 60% 줄였다.

RHI

HF Daily Papers Prompting Audio AINEW7시간 전· 8일 전 발행

25Hz 단일 코드북 토큰·멜로디 체인오브쏘트로 전체 곡 생성과 고해상도 48kHz 스테레오 렌더링을 연결한

Qwen-Music은 25Hz Music Semantic Token과 Melody-CoT를 핵심으로 하는 LLM 기반 파이프라인과 DiT+Spec-VAE+Band-Mode Refiner 렌더러를 결합해 텍스트·가사·참조 멜로디에서 고음질 보컬 포함 완결곡을 생성하는 시스템이다.

Melody-CoT Qwen-Music

HF Daily PapersNEW7시간 전· 4일 전 발행

프리트레이닝 손실이 RL 성능과 학습 속도를 결정하는 증거 기반 결과

체스 테스트베드를 이용해 프리트레이닝 손실이 고정 RL 계산에서 최종 성능을 예측하고 프리트레이닝 토큰 수가 RL 개선 속도의 기울기를 높인다는 합성 스케일링 법칙을 제시했다.

HF Daily PapersNEW7시간 전· 7일 전 발행

1.02M PR로 확인한 AI 리뷰 도입 방식별 효율과 리뷰 스멜 변화

207개 오픈소스 프로젝트의 1.02M PR 분석에서 Gradual AI와 Rapid AI Agent 도입은 리뷰 속도를 단축했지만 Rapid LLM 도입은 리뷰 스멜을 증가시킨 것으로 나타났다.

HF Daily PapersNEW7시간 전· 4일 전 발행

상태 저장 메모리·SID·잠재 추론으로 GPU 비용 52.4% 절감

RecGPT-V3는 Memory Hub, SID 기반 하이브리드 모달, Latent Intent Reasoning을 도입해 Taobao에서 IPV +1.28%·CTR +1.00%·TC +1.97%·GMV +3.97%를 달성하며 서빙 비용을 52.4% 절감했다.

HF Daily Papers Language ModelsNEW7시간 전· 6일 전 발행

데이터 혼합 self-evolution으로 HealthBench 등 의료 벤치마크 상위권을 달성한 Cura

Cura 1T는 Kimi-K2.6을 기반으로 LoRA 어댑터와 인간 게이트를 둔 self-evolution 루프를 이용해 벤치마크별 실패를 데이터로 해결한 결과 의료 평가 전반에서 우수한 성능을 보였다.

Cura 1T

HF Daily Papers ArchitectureNEW7시간 전· 5일 전 발행

시간적 특징 증강과 희소 업데이트로 Residual-state를 N=16까지 확장한 xHC

xHC는 temporal feature augmentation과 sparse residual updates를 결합해 residual-stream을 N=16으로 확장하여 mHC 대비 18B 모델에서 평균 downstream 점수를 +4.0 포인트 개선하고 동일 손실을 달성하는데 필요한 계산량을 1.19×로 단축했다.

mHC xHC

최신 AI 논문 요약 모음

최신 Paper 아티클