내용으로 건너뛰기
Out of the Box
사용자 도구
로그인
사이트 도구
검색
도구
원본 보기
이전 판
역링크
Fold/unfold all
최근 바뀜
미디어 관리자
사이트맵
로그인
>
최근 바뀜
미디어 관리자
사이트맵
추적:
•
2021-07_vector_quantized_models_for_planning
•
offline_rl
•
perception-prediction-reaction_agents_for_deep_reinforcement_learning
•
embodied_agent
•
2023-12_diloco_distributed_low-communication_training_of_language_models
•
2021-12_differentiable_spatial_planning_using_transformers
•
improving_language_understanding_by_generative_pre-training
•
human-level_ai
•
lora
•
distributed_rl
topic:distributed_rl
문서의 이전 판입니다!
Distributed RL
2019-11 DD-PPO: Learning Near-Perfect PointGoal Navigators from 2.5 Billion Frames
2020-10 Massively Large-Scale Distributed Reinforcement Learning with Menger
그 외 참고
2024-03 DiPaCo: Distributed Path Composition
2024-01 Asynchronous Local-SGD Training for Language Modeling
2023-12 DiLoCo: Distributed Low-Communication Training of Language Models
/var/www/html/data/pages/topic/distributed_rl.txt
· 마지막으로 수정됨:
2024/03/23 02:42
저자
127.0.0.1
문서 도구
원본 보기
이전 판
역링크
Fold/unfold all
맨 위로