• 내용으로 건너뛰기

Out of the Box

사용자 도구

  • 로그인

사이트 도구

  • 최근 바뀜
  • 미디어 관리자
  • 사이트맵
추적: • 2019-12_covariance_matrix_adaptation_for_the_rapid_illumination_of_behavior_space • 2024-10-31_project_sid_many-agent_simulations_toward_ai_civilization • 2024-01_stablelm-2-1.6b • 2016-08_popart_learning_values_across_many_orders_of_magnitude • 2021-07_epistemic_neural_networks • 2023-12_batched_low-rank_adaptation_of_foundation_models • 2023-10_mistral_7b • 2023-12_unicron_economizing_self-healing_llm_training_at_scale • 2017-03_model-agnostic_meta-learning_for_fast_adaptation_of_deep_networks • start

start

문서의 이전 판입니다!


  • Introduction (소개)
  • Archive
  • Tags

Current Topics

  • ChatBot
  • 관심
  • RL 환경
  • World Model
  • WASM
  • LLM 학습
  • Tiny LLM
  • RLHF, 선호학습
  • Question & Answer System
  • Plasticity
  • Mamba
  • LoRA
  • LLM: Long Context
  • LLM Self-Learning
  • LLM: MoE
  • LLM Game
  • LLM Fine-Tuning
  • LLM Agent
  • 한국어LLM(+비영어 LLM)
  • Human-level Game AI
  • 빠른 attention
  • Embodied Agent
  • Distributed RL

Old Topics

  • Offline RL
  • Large Batch
  • Data Mining
  • 자율주행
  • Action Space

start.1707334431.txt.gz · 마지막으로 수정됨: 2024/03/23 02:37 (바깥 편집)

문서 도구

  • 원본 보기
  • 이전 판
  • 역링크
  • Fold/unfold all
  • 맨 위로
별도로 명시하지 않을 경우, 이 위키의 내용은 다음 라이선스에 따라 사용할 수 있습니다: CC Attribution-Noncommercial-Share Alike 4.0 International
CC Attribution-Noncommercial-Share Alike 4.0 International Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki