tag:star

역링크

현재 문서를 가리키는 링크가 있는 문서 목록입니다.

review:2018-03_world_models
review:2019-01_paired_open-ended_trailblazer_poet_endlessly_generating_increasingly_complex_and_diverse_learning_environments_and_their_solutions
review:2019-10_grandmaster_level_in_starcraft_ii_using_multi-agent_reinforcement_learning
review:2019-10_v-mpo_on-policy_maximum_a_posteriori_policy_optimization_for_discrete_and_continuous_control
review:2019-11_dd-ppo_learning_near-perfect_pointgoal_navigators_from_2.5_billion_frames
review:2020-03_enhanced_poet_open-ended_reinforcement_learning_through_unbounded_invention_of_learning_challenges_and_their_solutions
review:2020-05_a_distributional_view_on_multi-objective_policy_optimization
review:2020-05_learning_simulate_dynamic_environments_gamegan
review:2020-10_implicit_under_parameterization_inhibits_data_efficient_deep_reinforcement_learning
review:2020-10_mastering_atari_go_chess_and_shogi_by_planning_with_a_learned_model
review:2020-10_smaller_world_models_for_reinforcement_learning
review:2021-01_brax_differentiable_physics_engine_large_scale_rigid_body_simulation
review:2021-02_paired_emergent_complexity_and_zero-shot_transfer_via_unsupervised_environment_design
review:2021-06_decision_transformer_reinforcement_learning_via_sequence_modeling
review:2021-06_reinforcement_learning_as_one_big_sequence_modeling_problem
review:2021-07_high-accuracy_model-based_reinforcement_learning_a_survey
review:2021-07_improve_agents_without_retraining_parallel_tree_search_off_policy_correction
review:2021-07_open-ended_learning_leads_to_generally_capable_agents
review:2021-07_vector_quantized_models_for_planning
review:2021-09_faster_improvement_rate_population_based_training
review:2021-11_procedural_generalization_by_planning_with_self-supervised_world_models
review:2023-12_efficient_large_language_models_a_survey