사용자 도구

사이트 도구


review:2018-06_maximum_a_posteriori_policy_optimisation

차이

문서의 선택한 두 판 사이의 차이를 보여줍니다.

차이 보기로 링크

다음 판
이전 판
review:2018-06_maximum_a_posteriori_policy_optimisation [2021/08/24 14:02] – 만듦 rex8312review:2018-06_maximum_a_posteriori_policy_optimisation [2024/03/23 02:42] (현재) – 바깥 편집 127.0.0.1
줄 1: 줄 1:
-====== 2018-06 Maximum a Posteriori Policy Optimisation ======+====== 2018-06 [MPO] Maximum a Posteriori Policy Optimisation ======
  
   * https://arxiv.org/abs/1806.06920   * https://arxiv.org/abs/1806.06920
 +  * https://paperswithcode.com/paper/maximum-a-posteriori-policy-optimisation
 +  * https://github.com/theogruner/rl_pro_telu
  
 {{tag>MPO DeepMind "Abbas Abdolmaleki" "Martin Riedmiller" 2018}} {{tag>MPO DeepMind "Abbas Abdolmaleki" "Martin Riedmiller" 2018}}
review/2018-06_maximum_a_posteriori_policy_optimisation.1629813730.txt.gz · 마지막으로 수정됨: (바깥 편집)