내용으로 건너뛰기
Out of the Box
사용자 도구
로그인
사이트 도구
검색
도구
원본 보기
이전 판
역링크
Fold/unfold all
최근 바뀜
미디어 관리자
사이트맵
로그인
>
최근 바뀜
미디어 관리자
사이트맵
추적:
•
2020-10_qplex_duplex_dueling_multi_agent_learning
•
autonomous_driving
•
quantum_computer
•
unicode
•
2020-10_smaller_world_models_for_reinforcement_learning
•
comment
•
ppo
ppo
문서의 이전 판입니다!
PPO
https://github.com/andompesta/ppo2
pytorch 구현
https://medium.com/@jonathan_hui/rl-proximal-policy-optimization-ppo-explained-77f014ec3f12
https://medium.com/@jonathan_hui/rl-trust-region-policy-optimization-trpo-explained-a6ee04eeeee9
TRPO
ppo.1582068008.txt.gz
· 마지막으로 수정됨:
2024/03/23 02:37
(바깥 편집)
문서 도구
원본 보기
이전 판
역링크
Fold/unfold all
맨 위로