내용으로 건너뛰기
Out of the Box
사용자 도구
로그인
사이트 도구
검색
도구
문서 보기
이전 판
Fold/unfold all
역링크
최근 바뀜
미디어 관리자
사이트맵
로그인
>
최근 바뀜
미디어 관리자
사이트맵
추적:
review:2024-01_self-rewarding_language_models
이 문서는 읽기 전용입니다. 원본을 볼 수는 있지만 바꿀 수는 없습니다. 문제가 있다고 생각하면 관리자에게 문의하세요.
====== 2024-01 Self-Rewarding Language Models ====== * https://arxiv.org/abs/2401.10020 * https://github.com/lucidrains/self-rewarding-lm-pytorch {{tag>self-play_learning self-reward self-learning RL LLM 2024 Meta}}
review/2024-01_self-rewarding_language_models.txt
· 마지막으로 수정됨: 2024/03/23 02:42 저자
127.0.0.1
문서 도구
문서 보기
이전 판
역링크
Fold/unfold all
맨 위로