사용자 도구

사이트 도구


offline_reinforcement_learning

차이

문서의 선택한 두 판 사이의 차이를 보여줍니다.

차이 보기로 링크

다음 판
이전 판
offline_reinforcement_learning [2020/06/08 02:28] – 만듦 rex8312offline_reinforcement_learning [2024/03/23 02:38] (현재) – 바깥 편집 127.0.0.1
줄 1: 줄 1:
 ====== Batch (Offline) Reinforcement Learning ====== ====== Batch (Offline) Reinforcement Learning ======
  
 +  * [[https://arxiv.org/abs/2005.01643|Offline Reinforcement Learning: Tutorial, Review, and Perspectives on Open Problems, 2020-05]]
 +    * Sergey Levine, Aviral Kumar
   * [[https://bair.berkeley.edu/blog/2019/12/05/bear/|Data-Driven Deep Reinforcement Learning, 2019-12]]   * [[https://bair.berkeley.edu/blog/2019/12/05/bear/|Data-Driven Deep Reinforcement Learning, 2019-12]]
   * [[https://arxiv.org/pdf/1911.11361.pdf|Behavior Regularized Offline Reinforcement Learning, 2019-11]]   * [[https://arxiv.org/pdf/1911.11361.pdf|Behavior Regularized Offline Reinforcement Learning, 2019-11]]
offline_reinforcement_learning.1591583300.txt.gz · 마지막으로 수정됨: 2024/03/23 02:37 (바깥 편집)