사용자 도구

사이트 도구


review:2018-06_maximum_a_posteriori_policy_optimisation

차이

문서의 선택한 두 판 사이의 차이를 보여줍니다.

차이 보기로 링크

양쪽 이전 판이전 판
다음 판
이전 판
review:2018-06_maximum_a_posteriori_policy_optimisation [2024/01/29 03:46] rex8312review:2018-06_maximum_a_posteriori_policy_optimisation [2024/03/23 02:42] (현재) – 바깥 편집 127.0.0.1
줄 3: 줄 3:
   * https://arxiv.org/abs/1806.06920   * https://arxiv.org/abs/1806.06920
   * https://paperswithcode.com/paper/maximum-a-posteriori-policy-optimisation   * https://paperswithcode.com/paper/maximum-a-posteriori-policy-optimisation
 +  * https://github.com/theogruner/rl_pro_telu
  
 {{tag>MPO DeepMind "Abbas Abdolmaleki" "Martin Riedmiller" 2018}} {{tag>MPO DeepMind "Abbas Abdolmaleki" "Martin Riedmiller" 2018}}
review/2018-06_maximum_a_posteriori_policy_optimisation.1706499991.txt.gz · 마지막으로 수정됨: (바깥 편집)