내용으로 건너뛰기
Out of the Box
사용자 도구
로그인
사이트 도구
검색
도구
원본 보기
이전 판
역링크
Fold/unfold all
최근 바뀜
미디어 관리자
사이트맵
로그인
>
최근 바뀜
미디어 관리자
사이트맵
추적:
•
2024-03_dipaco_distributed_path_composition
•
qa_system
•
playground
•
2016-10_reset-free_trial-and-error_learning_for_robot_damage_recovery
•
ascii_art
•
2021-03_teachmyagent_a_benchmark_for_automatic_curriculum_learning_in_deep_rl
•
a_generalized_framework_for_population_based_training
•
2024-01_mm-llms_recent_advances_in_multimodal_large_language_models
•
2020-10_smaller_world_models_for_reinforcement_learning
•
llm_fine_tuning
topic:llm_fine_tuning
문서의 이전 판입니다!
Topic: LLM Fine-Tuning
Fine-tuning 20B LLMs with RLHF on a 24GB consumer GPU
Phinetuning 2.0
Maixtchup: Make Your Own Mixture of Experts with Mergekit
topic/llm_fine_tuning.1707114678.txt.gz
· 마지막으로 수정됨:
2024/03/23 02:38
(바깥 편집)
문서 도구
원본 보기
이전 판
역링크
Fold/unfold all
맨 위로