내용으로 건너뛰기
Out of the Box
사용자 도구
로그인
사이트 도구
검색
도구
원본 보기
이전 판
역링크
Fold/unfold all
최근 바뀜
미디어 관리자
사이트맵
로그인
>
최근 바뀜
미디어 관리자
사이트맵
추적:
•
ninja
•
context_manager
•
2021-07_conservative_objective_models_for_effective_offline_model-based_optimization
•
2024-01_efficient_tool_use_with_chain-of-abstraction_reasoning
•
2023-07_polylm_an_open_source_polyglot_large_language_model
•
conv_chain
•
script
•
optimization
•
2024-01_tinyllama_an_open-source_small_language_model
•
a_self-tuning_actor-critic_algorithm
review:a_self-tuning_actor-critic_algorithm
문서의 이전 판입니다!
A Self-Tuning Actor-Critic Algorithm
https://arxiv.org/abs/2002.12928
IMPALA
,
DeepMind
,
hyperparameter
/var/www/html/data/pages/review/a_self-tuning_actor-critic_algorithm.txt
· 마지막으로 수정됨:
2024/03/23 02:42
저자
127.0.0.1
문서 도구
원본 보기
이전 판
역링크
Fold/unfold all
맨 위로