• 내용으로 건너뛰기

Out of the Box

사용자 도구

  • 로그인

사이트 도구

  • 최근 바뀜
  • 미디어 관리자
  • 사이트맵
추적: • improving_language_understanding_by_generative_pre-training • human-level_ai • lora • distributed_rl • reinforcement_learning_with_unsupervised_auxiliary_tasks • large_batch • 2021-07_scalable_evaluation_of_multi-agent_reinforcement_learning_with_melting_pot • llm_agent • 2023-01_gpt_in_60_lines_of_numpy • rl_env

topic:rl_env

RL 환경

  • 2024-02 Craftax: A Lightning-Fast Benchmark for Open-Ended Reinforcement Learning
  • 2023-06 Jumanji: a Diverse Suite of Scalable Reinforcement Learning Environments in JAX
  • 2023-03 [SIMA] Scaling Instructable Agents Across Many Simulated Worlds
topic/rl_env.txt · 마지막으로 수정됨: 2024/03/28 02:38 저자 rex8312

문서 도구

  • 원본 보기
  • 이전 판
  • 역링크
  • Fold/unfold all
  • 맨 위로
별도로 명시하지 않을 경우, 이 위키의 내용은 다음 라이선스에 따라 사용할 수 있습니다: CC Attribution-Noncommercial-Share Alike 4.0 International
CC Attribution-Noncommercial-Share Alike 4.0 International Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki