내용으로 건너뛰기

Out of the Box

사용자 도구

로그인

사이트 도구

최근 바뀜
미디어 관리자
사이트맵

추적: • quantum_computer • ppo

ppo

문서의 이전 판입니다!

PPO

https://github.com/andompesta/ppo2
- pytorch 구현
https://medium.com/@jonathan_hui/rl-proximal-policy-optimization-ppo-explained-77f014ec3f12
https://medium.com/@jonathan_hui/rl-trust-region-policy-optimization-trpo-explained-a6ee04eeeee9
- TRPO

ppo.1582068008.txt.gz · 마지막으로 수정됨: 2024/03/23 02:37 (바깥 편집)

문서 도구

원본 보기
이전 판
역링크
Fold/unfold all
맨 위로

별도로 명시하지 않을 경우, 이 위키의 내용은 다음 라이선스에 따라 사용할 수 있습니다: CC Attribution-Noncommercial-Share Alike 4.0 International