mlabonne/Gemmalpaca-2B - Каталог нейросетей
Генерация текста

mlabonne/Gemmalpaca-2B

Добавлено:
mlabonne/Gemmalpaca-2B

Это модель gemma-2b, тщательно настроенная на наборе данных vicgalle/alpaca-gpt4. В наборе тестов Nous он превосходит gemma-2b-it, версию чата Google. По большей части это проверка того, как работает точная настройка моделей Gemma в известном наборе данных. Получилось лучше, чем ожидалось. 🙂 У этой модели длина контекста 8к. Я рекомендую использовать его с шаблоном чата Alpaca, а НЕ с шаблоном Gemma Instruct (отлично работает с LM Studio). Вы также хотите добавить в качестве стоп-токена. Gemmalpaca-2B превосходит gemma-2b и gemma-2b-it в наборе тестов Nous (оценка выполняется с помощью LLM AutoEval). Посмотреть всю таблицу лидеров можно здесь. Он был обучен с помощью Axolotl со следующей конфигурацией.

Модальности:
Генерация текста


Задача: Генерация текста
Автор: mlabonne
Теги: gemma, model-index, text-generation-inference, endpoints_compatible
Лайков: 14  |  Загрузок: 82

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.