내용으로 건너뛰기
Out of the Box
사용자 도구
로그인
사이트 도구
검색
도구
문서 보기
이전 판
역링크
Fold/unfold all
최근 바뀜
미디어 관리자
사이트맵
로그인
>
최근 바뀜
미디어 관리자
사이트맵
추적:
•
2024-01_tinyllama_an_open-source_small_language_model
•
2020-07_distributed_associative_memory_network_with_memory_refreshing_loss
•
curl_contrastive_unsupervised_representations_for_reinforcement_learning
•
github
•
2021-02_learning_transferable_visual_models_from_natural_language_supervision
•
2019-12_quality-diversity_optimisation_algorithms
•
2024-02_large_language_model_for_table_processing_a_survey
•
dict
•
dl
•
drl
old_topic:action_space
이 문서는 읽기 전용입니다. 원본을 볼 수는 있지만 바꿀 수는 없습니다. 문제가 있다고 생각하면 관리자에게 문의하세요.
====== Action Space ====== ===== Large Action Space ===== * [[https://arxiv.org/pdf/2001.08116.pdf|Q-Learning in Enourmous Action Spaces via Amortized Approximate Maximization, 2020-01]] * DeepMind, Volodymyr Mnih * action space restriction * masked softmax * https://torchcraft.github.io/TorchCraftAI/docs/bptut-rl.html * https://gist.github.com/kaniblu/94f3ede72d1651b087a561cf80b306ca * https://discuss.pytorch.org/t/apply-mask-softmax/14212/12
old_topic/action_space.txt
· 마지막으로 수정됨:
2024/03/23 02:42
저자
127.0.0.1
문서 도구
문서 보기
이전 판
역링크
Fold/unfold all
맨 위로