Tarek07/Progenitor-V2.2-LLaMa-70B

После множества положительных отзывов о Progenitor V1.1 я получил несколько советов относительно нескольких настроек, которые я мог бы настроить для получения, надеюсь, лучших результатов. В основном меняют токенизатор и позволяют слиянию вычисляться с полным числом float32 перед масштабированием до bfloat16 (спасибо kromeurus). Версия 2.1 не совсем соответствовала стандарту, установленному в версии 1.1, поэтому, внеся еще несколько изменений, я сделал версию 2.2, которая, как мне кажется, немного улучшилась по сравнению с выдающейся версией 1.1 и, следовательно, является истинным преемником. Это объединение предварительно обученных языковых моделей, созданных с помощью mergekit. Эта модель была объединена с использованием метода линейного слияния DELLA с использованием nbeerbower/Llama-3.1-Nemotron-lorablated-70B в качестве основы. В объединение были включены следующие модели: TheDrummer/Anubis-70B-v1 EVA-UNIT-01/EVA-LLaMA-3.33-70B-v0.1 Sao10K/70B-L3.3-Cirrus-x1 SicariusSicariiStuff/NegativeLLAMA70B * Sao10K/L3.1-70B-Hanami-x1 Для создания этой модели использовалась конфигурация YAML:

Модальности:
Генерация текста

Области применения:
Диалог / чат

Задача: Генерация текста
Автор: Tarek07
Теги: llama, mergekit, merge, conversational, text-generation-inference, endpoints_compatible
Лайков: 8 | Загрузок: 4

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

Генерация текста

Похожие модели (Генерация текста)

Neko-Institute-of-Science/LLaMA-65B-4bit-32g

AXCXEPT/Llama-3.1-8B-EZO-1.1-it

hon9kon9ize/CantoneseLLMChat-v0.5

Henk717/airochronos-33B