사용자 도구

사이트 도구


review:2024-01_self-rewarding_language_models

차이

문서의 선택한 두 판 사이의 차이를 보여줍니다.

차이 보기로 링크

다음 판
이전 판
review:2024-01_self-rewarding_language_models [2024/01/19 03:38] – 만듦 rex8312review:2024-01_self-rewarding_language_models [2024/03/23 02:42] (현재) – 바깥 편집 127.0.0.1
줄 2: 줄 2:
  
   * https://arxiv.org/abs/2401.10020   * https://arxiv.org/abs/2401.10020
 +  * https://github.com/lucidrains/self-rewarding-lm-pytorch
  
-{{tag>self-play_learning self-reward RL LLM 2024 Meta}}+{{tag>self-play_learning self-reward self-learning RL LLM 2024 Meta}}
  
  
  
  
review/2024-01_self-rewarding_language_models.1705635522.txt.gz · 마지막으로 수정됨: (바깥 편집)