mlabonne/Gemmalpaca-2B

Это модель gemma-2b, тщательно настроенная на наборе данных vicgalle/alpaca-gpt4. В наборе тестов Nous он превосходит gemma-2b-it, версию чата Google. По большей части это проверка того, как работает точная настройка моделей Gemma в известном наборе данных. Получилось лучше, чем ожидалось. 🙂 У этой модели длина контекста 8к. Я рекомендую использовать его с шаблоном чата Alpaca, а НЕ с шаблоном Gemma Instruct (отлично работает с LM Studio). Вы также хотите добавить в качестве стоп-токена. Gemmalpaca-2B превосходит gemma-2b и gemma-2b-it в наборе тестов Nous (оценка выполняется с помощью LLM AutoEval). Посмотреть всю таблицу лидеров можно здесь. Он был обучен с помощью Axolotl со следующей конфигурацией.

Модальности:
Генерация текста

Задача: Генерация текста
Автор: mlabonne
Теги: gemma, model-index, text-generation-inference, endpoints_compatible
Лайков: 14 | Загрузок: 82

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

Генерация текста

Похожие модели (Генерация текста)

Aeala/GPT4-x-AlpacaDente-30b-4bit

karpathy/gpt2_1558M_final2_hf

Mungert/Dans-PersonalityEngine-V1.3.0-24b-GGUF

Orion-zhen/phi-4-abliterated