내용으로 건너뛰기
Out of the Box
사용자 도구
로그인
사이트 도구
검색
도구
문서 보기
이전 판
Fold/unfold all
역링크
최근 바뀜
미디어 관리자
사이트맵
로그인
>
최근 바뀜
미디어 관리자
사이트맵
추적:
dpo
TAG: dpo
2023-12 [DPO] Direct Preference Optimization: Your Language Model is Secretly a Reward Model
2024/02/07 09:50
Hyunsoo Park
2024-01 Contrastive Preference Optimization: Pushing the Boundaries of LLM Performance in Machine Translation
2024/01/23 03:24
Hyunsoo Park
문서 도구
문서 보기
이전 판
역링크
Fold/unfold all
맨 위로