Это модель gemma-2b, тщательно настроенная на наборе данных vicgalle/alpaca-gpt4. В наборе тестов Nous он превосходит gemma-2b-it, версию чата Google. По большей части это проверка того, как работает точная настройка моделей Gemma в известном наборе данных. Получилось лучше, чем ожидалось. 🙂 У этой модели длина контекста 8к. Я рекомендую использовать его с шаблоном чата Alpaca, а НЕ с шаблоном Gemma Instruct (отлично работает с LM Studio). Вы также хотите добавить в качестве стоп-токена. Gemmalpaca-2B превосходит gemma-2b и gemma-2b-it в наборе тестов Nous (оценка выполняется с помощью LLM AutoEval). Посмотреть всю таблицу лидеров можно здесь. Он был обучен с помощью Axolotl со следующей конфигурацией.
Модальности:
Генерация текста
Задача: Генерация текста
Автор: mlabonne
Теги: gemma, model-index, text-generation-inference, endpoints_compatible
Лайков: 14 | Загрузок: 82
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.