내용으로 건너뛰기
Out of the Box
사용자 도구
로그인
사이트 도구
검색
도구
원본 보기
이전 판
역링크
Fold/unfold all
최근 바뀜
미디어 관리자
사이트맵
로그인
>
최근 바뀜
미디어 관리자
사이트맵
추적:
•
2021-07_reasoning-modulated_representations
•
mo-v-mpo
•
autonomous_driving
•
2024-03_dipaco_distributed_path_composition
•
qa_system
•
2023-10_a_general_theoretical_paradigm_to_understand_learning_from_human_preferences
•
a_generalized_framework_for_population_based_training
•
2021-01_addressing_some_limitations_of_transformers_with_feedback_memory
•
rlhf
•
2020-12_deepmind_lab2d
review:2020-12_deepmind_lab2d
문서의 이전 판입니다!
2020-12 DeepMind Lab2D
https://arxiv.org/abs/2011.07027
Lab2D
,
grid world
,
AI platform
,
RL
,
MARL
,
DeepMind
,
Charles Beattie
,
Joel Z. Leibo
,
2020
/var/www/html/data/pages/review/2020-12_deepmind_lab2d.txt
· 마지막으로 수정됨:
2024/03/23 02:42
저자
127.0.0.1
문서 도구
원본 보기
이전 판
역링크
Fold/unfold all
맨 위로