• 내용으로 건너뛰기

Out of the Box

사용자 도구

  • 로그인

사이트 도구

  • 최근 바뀜
  • 미디어 관리자
  • 사이트맵
추적: • 2021-07_vector_quantized_models_for_planning • offline_rl • perception-prediction-reaction_agents_for_deep_reinforcement_learning • embodied_agent • 2023-12_diloco_distributed_low-communication_training_of_language_models • 2021-12_differentiable_spatial_planning_using_transformers • improving_language_understanding_by_generative_pre-training • human-level_ai • lora • distributed_rl

topic:distributed_rl

문서의 이전 판입니다!


Distributed RL

  • 2019-11 DD-PPO: Learning Near-Perfect PointGoal Navigators from 2.5 Billion Frames

  • 2020-10 Massively Large-Scale Distributed Reinforcement Learning with Menger

그 외 참고

  • 2024-03 DiPaCo: Distributed Path Composition
  • 2024-01 Asynchronous Local-SGD Training for Language Modeling
  • 2023-12 DiLoCo: Distributed Low-Communication Training of Language Models
/var/www/html/data/pages/topic/distributed_rl.txt · 마지막으로 수정됨: 2024/03/23 02:42 저자 127.0.0.1

문서 도구

  • 원본 보기
  • 이전 판
  • 역링크
  • Fold/unfold all
  • 맨 위로
별도로 명시하지 않을 경우, 이 위키의 내용은 다음 라이선스에 따라 사용할 수 있습니다: CC Attribution-Noncommercial-Share Alike 4.0 International
CC Attribution-Noncommercial-Share Alike 4.0 International Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki