내용으로 건너뛰기
Out of the Box
사용자 도구
로그인
사이트 도구
검색
도구
원본 보기
이전 판
역링크
Fold/unfold all
최근 바뀜
미디어 관리자
사이트맵
로그인
>
최근 바뀜
미디어 관리자
사이트맵
추적:
•
dimension_reduction
•
stastics
•
rain
•
unifying_perspective_neighbor_embeddings_along_attraction_repulsion_spectrum
•
pyinquirer
•
cheet_sheets
•
meta_lr_schedule_net_learned_schedules_scale_generalize
•
hyperbolic_discounting_learning_over_multiple_horizons
•
motion
•
phasic_policy_gradient
phasic_policy_gradient
문서의 이전 판입니다!
Phasic Policy Gradient
https://arxiv.org/abs/2009.04416
https://github.com/openai/phasic-policy-gradient
PPG
,
PPO
,
sample efficiency
,
Oleg Klimov
,
John Schulman
,
2020
/var/www/html/data/pages/phasic_policy_gradient.txt
· 마지막으로 수정됨:
2024/03/23 02:38
저자
127.0.0.1
문서 도구
원본 보기
이전 판
역링크
Fold/unfold all
맨 위로