akjindal53244/Llama-3.1-Storm-8B

Авторы: Ашвини Кумар Джиндал, Паван Кумар Раджпут, Анкур Парих, Акшита Сухлеча 🤗 Блог об анонсе Hugging Face: https://huggingface.co/blog/akjindal53244/llama31-storm8b Мы представляем модель Llama-3.1-Storm-8B, которая превосходит по производительности Meta AI. Модели Llama-3.1-8B-Instruct и Hermes-3-Llama-3.1-8B существенно отличаются в различных тестах, как показано на графике сравнения производительности в следующем разделе. Наш подход состоит из трех ключевых этапов: 1. Самокурирование. Мы применили два метода самокурирования, чтобы выбрать примерно 1 миллион высококачественных примеров из пула примерно в 2,8 миллиона примеров с открытым исходным кодом. Наши критерии курирования были сосредоточены на образовательной ценности и уровне сложности, используя один и тот же SLM для аннотаций вместо более крупных моделей (например, 70B, 405B). 2. Целевая точная настройка. Мы выполнили целевую тонкую настройку на основе Spectrum для модели Llama-3.1-8B-Instruct. Метод Spectrum ускоряет обучение, выборочно нацелив модули слоев на основе их отношения сигнал/шум (SNR) и заморозив оставшиеся модули. В нашей работе 50% слоев заморожены. 3. Объединение моделей. Мы объединили нашу точно настроенную модель с моделью Ламы-Искры, используя метод SLERP. Метод слияния дает…

Модальности:
Генерация текста

Области применения:
Логика и рассуждение Диалог / чат

Задача: Генерация текста
Автор: akjindal53244
Теги: llama, llama-3.1, conversational, instruction following, reasoning, function calling, mergekit, finetuning
Лайков: 177 | Загрузок: 3,187

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

LLM360/K2-Think

tiiuae/Falcon3-Mamba-7B-Instruct

TheBloke/Yarn-Llama-2-13B-128K-GPTQ

ValiantLabs/Qwen3-14B-Esper3