내용으로 건너뛰기
Out of the Box
사용자 도구
로그인
사이트 도구
검색
도구
원본 보기
이전 판
역링크
Fold/unfold all
최근 바뀜
미디어 관리자
사이트맵
로그인
>
최근 바뀜
미디어 관리자
사이트맵
추적:
•
2021-04_efficientnetv2_smaller_models_and_faster_training
•
2020-05_learning_simulate_dynamic_environments_gamegan
•
2023-08_maintaining_plasticity_in_continual_learning_via_regenerative_regularization
•
evolutionary_population_curriculum_for_scaling_multi-agent_reinforcement_learning
•
2021-07_few-shot_neural_architecture_search
•
2023-06_secrets_of_rlhf_in_large_language_models_part_i_ppo
•
2024-01_seeclick_harnessing_gui_grounding_for_advanced_visual_gui_agents
•
2023-10_large_language_models_as_generalizable_policies_for_embodied_tasks
•
ppg
•
2024-02_return-aligned_decision_transformer
review:2024-02_return-aligned_decision_transformer
2024-02 Return-Aligned Decision Transformer
https://arxiv.org/abs/2402.03923
RL
,
제어가능
,
2024
,
DT
review/2024-02_return-aligned_decision_transformer.txt
· 마지막으로 수정됨:
2024/04/25 00:06
저자
rex8312
문서 도구
원본 보기
이전 판
역링크
Fold/unfold all
맨 위로