내용으로 건너뛰기
Out of the Box
사용자 도구
로그인
사이트 도구
검색
도구
문서 보기
이전 판
역링크
Fold/unfold all
최근 바뀜
미디어 관리자
사이트맵
로그인
>
최근 바뀜
미디어 관리자
사이트맵
추적:
•
conv_chain
•
script
•
optimization
•
2024-01_tinyllama_an_open-source_small_language_model
•
a_self-tuning_actor-critic_algorithm
•
2021-07_visual_adversarial_imitation_learning_using_variational_models
•
rotating_cube
•
2021-06_extracting_training_data_from_large_language_models
•
2024-08_pcgrl_scaling_control_and_generalization_in_reinforcement_learning_level_generators
•
2019-12_quality-diversity_optimisation_algorithms
value_function_polytope_reinforcement_learning
이 문서는 읽기 전용입니다. 원본을 볼 수는 있지만 바꿀 수는 없습니다. 문제가 있다고 생각하면 관리자에게 문의하세요.
====== The Value Function Polytope in Reinforcement Learning ====== * https://arxiv.org/abs/1901.11524v3 {{tag>"Marc G. Bellemare" Google}}
value_function_polytope_reinforcement_learning.txt
· 마지막으로 수정됨:
2024/03/23 02:38
저자
127.0.0.1
문서 도구
문서 보기
이전 판
역링크
Fold/unfold all
맨 위로