내용으로 건너뛰기
Out of the Box
사용자 도구
로그인
사이트 도구
검색
도구
원본 보기
이전 판
역링크
Fold/unfold all
최근 바뀜
미디어 관리자
사이트맵
로그인
>
최근 바뀜
미디어 관리자
사이트맵
추적:
•
2020-10_massively_large_scale_distributed_reinforcement_learning_menger
•
data_mining
•
2017-11_neural_discrete_representation_learning
•
2024-08_diffusion_models_are_real-time_game_engines
•
2020-06_conservative_q-learning_for_offline_reinforcement_learning
•
2021-07_offline_meta-reinforcement_learning_with_online_self-supervision
•
database
•
2d_level_design
•
dbms
•
llm_fine_tuning
topic:llm_fine_tuning
문서의 이전 판입니다!
LLM Fine-Tuning
Fine-tuning 20B LLMs with RLHF on a 24GB consumer GPU
Phinetuning 2.0
2024-10 Fira: Can We Achieve Full-rank Training of LLMs Under Low-rank Constraint?
2024-03 Parameter-Efficient Fine-Tuning for Large Models: A Comprehensive Survey
2024-03 GaLore: Memory-Efficient LLM Training by Gradient Low-Rank Projection
2023-12 Batched Low-Rank Adaptation of Foundation Models
topic/llm_fine_tuning.1707293312.txt.gz
· 마지막으로 수정됨:
2024/03/23 02:38
(바깥 편집)
문서 도구
원본 보기
이전 판
역링크
Fold/unfold all
맨 위로