Out of the Box

문서의 이전 판입니다!

2024년 1월의 게시물 54개

2024-01 In-context Learning with Retrieved Demonstrations for Language Models: A Survey	2024/01/25 07:47	Hyunsoo Park
2024-01 MambaByte: Token-free Selective State Space Model	2024/01/25 05:30	Hyunsoo Park
2024-01 MM-LLMs: Recent Advances in MultiModal Large Language Models	2024/01/25 05:28	Hyunsoo Park
2023-07 PolyLM: An Open Source Polyglot Large Language Model	2024/01/24 01:17	Hyunsoo Park
2023-08 JIANG: Chinese Open Foundation Language Model	2024/01/24 01:13	Hyunsoo Park
2023-06 A Technical Report for Polyglot-Ko: Open-Source Large-Scale Korean Language Models	2024/01/24 01:07	Hyunsoo Park
2023-03 A Survey of Large Language Models	2024/01/24 00:28	Hyunsoo Park
2024-01 WARM: On the Benefits of Weight Averaged Reward Models	2024/01/23 14:28	Hyunsoo Park
2024-01 StreamVoice: Streamable Context-Aware Language Modeling for Real-time Zero-Shot Voice Conversion	2024/01/23 14:24	Hyunsoo Park
2024-01 SeeClick: Harnessing GUI Grounding for Advanced Visual GUI Agents	2024/01/23 14:09	Hyunsoo Park
2024-01 Metacognition is all you need? Using Introspection in Generative Agents to Improve Goal-directed Behavior	2024/01/23 14:02	Hyunsoo Park
2024-01 BioFinBERT: Finetuning Large Language Models (LLMs) to Analyze Sentiment of Press Releases and Financial Text Around Inflection Points of Biotech Stocks	2024/01/23 13:56	Hyunsoo Park
2024-01 Coevolving Artistic Images Using OMNIREP	2024/01/23 13:27	Hyunsoo Park
2024-01 Medusa: Simple LLM Inference Acceleration Framework with Multiple Decoding Heads	2024/01/23 03:38	Hyunsoo Park
2024-01 Contrastive Preference Optimization: Pushing the Boundaries of LLM Performance in Machine Translation	2024/01/23 03:24	Hyunsoo Park
2023-12 Speeding up the GPT - KV cache	2024/01/22 03:25	Hyunsoo Park
2024-01 Code Generation with AlphaCodium: From Prompt Engineering to Flow Engineering	2024/01/22 02:07	Hyunsoo Park
2024-01 Towards Conversational Diagnostic AI	2024/01/22 01:39	Hyunsoo Park
2024-01 Whisper Speech	2024/01/22 00:29	Hyunsoo Park
2024-11 Transformers are Multi-State RNNs	2024/01/22 00:26	Hyunsoo Park
2023-01 GPT in 60 Lines of NumPy	2024/01/22 00:18	Hyunsoo Park
2024-01 StableLM-2-1.6B	2024/01/21 23:52	Hyunsoo Park
2024-01 LLM Maybe LongLM: Self-Extend LLM Context Window Without Tuning	2024/01/21 23:45	Hyunsoo Park
2024-01 WorldDreamer: Towards General World Models for Video Generation via Predicting Masked Tokens	2024/01/19 03:42	Hyunsoo Park
2024-01 Self-Rewarding Language Models	2024/01/19 03:38	Hyunsoo Park
2024-01 Bridging State and History Representations: Understanding Self-Predictive RL	2024/01/19 00:13	Hyunsoo Park
2024-01 RAG vs Fine-tuning: Pipelines, Tradeoffs, and a Case Study on Agriculture	2024/01/18 23:59	Hyunsoo Park
2024-01 ReFT: Reasoning with Reinforced Fine-Tuning	2024/01/18 05:32	Hyunsoo Park
2024-01 Asynchronous Local-SGD Training for Language Modeling	2024/01/18 05:07	Hyunsoo Park
2024-01 DeepSeekMoE: Towards Ultimate Expert Specialization in Mixture-of-Experts Language Models	2024/01/18 00:53	Hyunsoo Park
2024-01 Parrot: Pareto-optimal Multi-Reward Reinforcement Learning Framework for Text-to-Image Generation	2024/01/18 00:29	Hyunsoo Park
2023-10 Mistral 7B	2024/01/15 02:58	Hyunsoo Park
2024-01 Monte Carlo Tree Search for Recipe Generation using GPT-2	2024/01/11 20:14	Hyunsoo Park
2024-01 Agent Alignment in Evolving Social Norms	2024/01/11 01:29	Hyunsoo Park
2024-01 [SPO] A Minimaximalist Approach to Reinforcement Learning from Human Feedback	2024/01/11 00:20	Hyunsoo Park
2024-01 [MAGNeT] Masked Audio Generation using a Single Non-Autoregressive Transformer	2024/01/11 00:16	Hyunsoo Park
2024-01 Mixtral of Experts	2024/01/10 23:51	Hyunsoo Park
2023-12 LLM-Powered Hierarchical Language Agent for Real-time Human-AI Coordination	2024/01/10 23:35	Hyunsoo Park
2023-12 Unicron: Economizing Self-Healing LLM Training at Scale	2024/01/10 23:21	Hyunsoo Park
2023-12 DiLoCo: Distributed Low-Communication Training of Language Models	2024/01/10 23:19	Hyunsoo Park
2024-01 A Survey on Efficient Federated Learning Methods for Foundation Model Training	2024/01/10 22:55	Hyunsoo Park
2024-01 Large Language Models for Robotics: Opportunities, Challenges, and Perspectives	2024/01/10 22:46	Hyunsoo Park
2024-01 Learn Once Plan Arbitrarily (LOPA): Attention-Enhanced Deep Reinforcement Learning Method for Global Path Planning	2024/01/10 22:42	Hyunsoo Park
2023-03 [MEMES] Multiple Hands Make Light Work: Enhancing Quality and Diversity using MAP-Elites with Multiple Parallel Evolution Strategies	2024/01/10 05:44	Hyunsoo Park
2021-04 Counter-Strike Deathmatch with Large-Scale Behavioural Cloning	2024/01/10 04:27	Hyunsoo Park
2023-03 Understanding plasticity in neural networks	2024/01/10 04:20	Hyunsoo Park
2023-08 Maintaining Plasticity in Continual Learning via Regenerative Regularization	2024/01/10 04:17	Hyunsoo Park
2022-09 Learning to Learn with Generative Models of Neural Network Checkpoints	2024/01/10 02:20	Hyunsoo Park
2024-01 SpeechAgents: Human-Communication Simulation with Multi-Modal Multi-Agent Systems	2024/01/10 01:16	Hyunsoo Park
2023-05 Improving Language Model Negotiation with Self-Play and In-Context Learning from AI Feedback	2024/01/10 00:24	Hyunsoo Park
2023-05 Deep Reinforcement Learning with Plasticity Injection	2024/01/09 23:01	Hyunsoo Park
2022-05 Simplex Neural Population Learning: Any-Mixture Bayes-Optimality in Symmetric Zero-sum Games	2024/01/08 06:51	Hyunsoo Park
2023-04 Generative Agents: Interactive Simulacra of Human Behavior	2024/01/08 05:37	Hyunsoo Park
2024-01 TinyLlama: An Open-Source Small Language Model	2024/01/07 17:40	Hyunsoo Park

Archive

2024년 1월의 게시물 54개