====== Batch (Offline) Reinforcement Learning ======

  * [[https://arxiv.org/abs/2005.01643|Offline Reinforcement Learning: Tutorial, Review, and Perspectives on Open Problems, 2020-05]]
    * Sergey Levine, Aviral Kumar
  * [[https://bair.berkeley.edu/blog/2019/12/05/bear/|Data-Driven Deep Reinforcement Learning, 2019-12]]
  * [[https://arxiv.org/pdf/1911.11361.pdf|Behavior Regularized Offline Reinforcement Learning, 2019-11]]
  * [[https://arxiv.org/abs/1910.01708|Benchmarking Batch Deep Reinforcement Learning Algorithms, 2019-10]]
    * Scott Fujimoto
  * [[https://arxiv.org/abs/1812.02900|Off-Policy Deep Reinforcement Learning without Exploration, 2018-07]]
    * Scott Fujimoto