내용으로 건너뛰기
Out of the Box
사용자 도구
로그인
사이트 도구
검색
도구
원본 보기
이전 판
역링크
Fold/unfold all
최근 바뀜
미디어 관리자
사이트맵
로그인
>
최근 바뀜
미디어 관리자
사이트맵
추적:
•
https
•
train_llm
•
continuous_control
•
neural_network_viwer
•
compressive_transformer
•
clustering
•
sliceout_training_transformers_cnns_faster_while_using_less_memory
•
chainer_deep_learning_framework_accelerating_research_cycle
•
tiny_llm
•
offline_reinforcement_learning
offline_reinforcement_learning
문서의 이전 판입니다!
Batch (Offline) Reinforcement Learning
Data-Driven Deep Reinforcement Learning, 2019-12
Behavior Regularized Offline Reinforcement Learning, 2019-11
Benchmarking Batch Deep Reinforcement Learning Algorithms, 2019-10
Scott Fujimoto
Off-Policy Deep Reinforcement Learning without Exploration, 2018-07
Scott Fujimoto
offline_reinforcement_learning.1591583300.txt.gz
· 마지막으로 수정됨:
2024/03/23 02:37
(바깥 편집)
문서 도구
원본 보기
이전 판
역링크
Fold/unfold all
맨 위로