사용자 도구

사이트 도구


review:2024-01_self-rewarding_language_models

차이

문서의 선택한 두 판 사이의 차이를 보여줍니다.

차이 보기로 링크

양쪽 이전 판이전 판
다음 판
이전 판
review:2024-01_self-rewarding_language_models [2024/01/19 03:39] – [2024-01 Self-Rewarding Language Models] rex8312review:2024-01_self-rewarding_language_models [2024/03/23 02:42] (현재) – 바깥 편집 127.0.0.1
줄 2: 줄 2:
  
   * https://arxiv.org/abs/2401.10020   * https://arxiv.org/abs/2401.10020
 +  * https://github.com/lucidrains/self-rewarding-lm-pytorch
  
 {{tag>self-play_learning self-reward self-learning RL LLM 2024 Meta}} {{tag>self-play_learning self-reward self-learning RL LLM 2024 Meta}}
review/2024-01_self-rewarding_language_models.1705635584.txt.gz · 마지막으로 수정됨: (바깥 편집)