내용으로 건너뛰기
Out of the Box
사용자 도구
로그인
사이트 도구
검색
도구
원본 보기
이전 판
Fold/unfold all
역링크
최근 바뀜
미디어 관리자
사이트맵
로그인
>
최근 바뀜
미디어 관리자
사이트맵
추적:
•
reinforcement_learning_with_unsupervised_auxiliary_tasks
•
2023-12_batched_low-rank_adaptation_of_foundation_models
•
2021-10_embodied_intelligence_via_learning_and_evolution
•
2020-10_smaller_world_models_for_reinforcement_learning
•
collaborative_agent_gameplay_in_the_pandemic_board_game
•
2020-06_rigging_the_lottery_making_all_tickets_winners
•
2020-05_learning_simulate_dynamic_environments_gamegan
•
a_generalized_framework_for_population_based_training
•
2024-01_tinyllama_an_open-source_small_language_model
•
2019-05_open_ended_learning_symmetric_zero_sum_games
review:2019-05_open_ended_learning_symmetric_zero_sum_games
2019-05 Open-ended Learning in Symmetric Zero-sum Games
https://arxiv.org/abs/1901.08106
PSRO
,
Game Theory
,
PBT
,
Self-Play
,
Open-ended Learning
,
co-evolution
,
RPS
,
DeepMind
,
David Balduzzi
,
Marta Garnelo
,
Yoram Bachrach
,
Wojciech M. Czarnecki
,
Julien Perolat
,
Max Jaderberg
,
Thore Graepel
,
2019
review/2019-05_open_ended_learning_symmetric_zero_sum_games.txt
· 마지막으로 수정됨: 2024/03/23 02:42 저자
127.0.0.1
문서 도구
원본 보기
이전 판
역링크
Fold/unfold all
맨 위로