내용으로 건너뛰기
Out of the Box
사용자 도구
로그인
사이트 도구
검색
도구
문서 보기
이전 판
역링크
Fold/unfold all
최근 바뀜
미디어 관리자
사이트맵
로그인
>
최근 바뀜
미디어 관리자
사이트맵
추적:
•
2024-02_large_language_model_for_table_processing_a_survey
•
2024-02_puzzle_solving_using_reasoning_of_large_language_models_a_survey
•
2024-04_a_survey_on_efficient_inference_for_large_language_models
•
2024-01_asynchronous_local-sgd_training_for_language_modeling
•
2023-05_deep_reinforcement_learning_with_plasticity_injection
•
qd_grid_visualize
•
drl
•
2021-04_actionable_models_unsupervised_offline_reinforcement_learning_of_robotic_skills
•
2021-11_procedural_generalization_by_planning_with_self-supervised_world_models
•
2021-02_learning_transferable_visual_models_from_natural_language_supervision
proximal_policy_optimization_mixed_distributed_training
이 문서는 읽기 전용입니다. 원본을 볼 수는 있지만 바꿀 수는 없습니다. 문제가 있다고 생각하면 관리자에게 문의하세요.
====== Proximal Policy Optimization with Mixed Distributed Training ====== * https://arxiv.org/abs/1907.06479v3 {{tag>PPO "Distributed Computing" PBT LASER 2019}}
proximal_policy_optimization_mixed_distributed_training.txt
· 마지막으로 수정됨:
2024/03/23 02:38
저자
127.0.0.1
문서 도구
문서 보기
이전 판
역링크
Fold/unfold all
맨 위로