본문으로 건너뛰기
AI Trends
피드
트렌딩
커뮤니티
공지
로그인
피드
트렌딩
커뮤니티
공지
Flow-GRPO (Flow-GRPO) 용어 설명 | AI Trends
Flow-GRPO
Flow-GRPO
중급
Flow-GRPO는 텍스트-이미지 생성에서 정책 최적화를 위한 RL 기법으로, 루브릭 보상을 이용한 학습 신호를 흐름 기반으로 최적화한다.
비슷한 개념
diffusionnft
SDE-GRPO
Proxy Prompt Reinforcement Learning
fs-grpo
group-relative-policy-optimization
gflownet
ReA-GRPO
gflownets
← 용어 사전 전체 보기