offline_reinforcement_learning

차이

문서의 선택한 두 판 사이의 차이를 보여줍니다.

차이 보기로 링크

--- offline_reinforcement_learning [2020/06/08 02:28] – 만듦 rex8312
+++ offline_reinforcement_learning [2024/03/23 02:38] (현재) – 바깥 편집 127.0.0.1
@@ 줄 1: / 줄 1: @@
 ====== Batch (Offline) Reinforcement Learning ======
+  * [[https://arxiv.org/abs/2005.01643|Offline Reinforcement Learning: Tutorial, Review, and Perspectives on Open Problems, 2020-05]]
+    * Sergey Levine, Aviral Kumar
   * [[https://bair.berkeley.edu/blog/2019/12/05/bear/|Data-Driven Deep Reinforcement Learning, 2019-12]]
   * [[https://arxiv.org/pdf/1911.11361.pdf|Behavior Regularized Offline Reinforcement Learning, 2019-11]]

offline_reinforcement_learning.1591583300.txt.gz · 마지막으로 수정됨: 2024/03/23 02:37 (바깥 편집)