내용으로 건너뛰기
Out of the Box
사용자 도구
로그인
사이트 도구
검색
도구
원본 보기
이전 판
Fold/unfold all
역링크
최근 바뀜
미디어 관리자
사이트맵
로그인
>
최근 바뀜
미디어 관리자
사이트맵
추적:
•
action_space
old_topic:action_space
Action Space
Large Action Space
Q-Learning in Enourmous Action Spaces via Amortized Approximate Maximization, 2020-01
DeepMind, Volodymyr Mnih
action space restriction
masked softmax
https://torchcraft.github.io/TorchCraftAI/docs/bptut-rl.html
https://gist.github.com/kaniblu/94f3ede72d1651b087a561cf80b306ca
https://discuss.pytorch.org/t/apply-mask-softmax/14212/12
old_topic/action_space.txt
· 마지막으로 수정됨: 2024/03/23 02:42 저자
127.0.0.1
문서 도구
원본 보기
이전 판
역링크
Fold/unfold all
맨 위로