사용자 도구

사이트 도구


ppo

차이

문서의 선택한 두 판 사이의 차이를 보여줍니다.

차이 보기로 링크

양쪽 이전 판이전 판
다음 판
이전 판
ppo [2018/11/15 00:09] rex8312ppo [2024/03/23 02:38] (현재) – 바깥 편집 127.0.0.1
줄 1: 줄 1:
 ====== PPO ====== ====== PPO ======
  
 +  * https://github.com/andompesta/ppo2
 +    * PPO2 pytorch 구현
   * https://medium.com/@jonathan_hui/rl-proximal-policy-optimization-ppo-explained-77f014ec3f12   * https://medium.com/@jonathan_hui/rl-proximal-policy-optimization-ppo-explained-77f014ec3f12
-  * TRPO +  * https://medium.com/@jonathan_hui/rl-trust-region-policy-optimization-trpo-explained-a6ee04eeeee9 
-    * https://medium.com/@jonathan_hui/rl-trust-region-policy-optimization-trpo-explained-a6ee04eeeee9+    * TRPO
  
ppo.1542240540.txt.gz · 마지막으로 수정됨: (바깥 편집)