BSC-LT/salamandra-2b-instruct - Каталог нейросетей
Генерация текста

BSC-LT/salamandra-2b-instruct

Добавлено:
BSC-LT/salamandra-2b-instruct

Этот репозиторий содержит модель, описанную в техническом отчете Salamandra. Саламандра — это многоязычная модель, предварительно обученная с нуля, которая поставляется с тремя различными размерами — параметрами 2B, 7B и 40B — с соответствующими базовыми вариантами и вариантами, настроенными с помощью инструкций. Эта модель карты соответствует версии с инструкциями 2B. Чтобы просмотреть карты моделей других версий Salamandra, обратитесь к указателю моделей. Все семейство Salamandra выпускается под разрешительной лицензией Apache 2.0. Наряду с открытыми весами все сценарии обучения и файлы конфигурации выложены в открытый доступ в этом репозитории GitHub. > [!ВНИМАНИЕ] > ОТКАЗ ОТ ОТВЕТСТВЕННОСТИ: Эта модель является первой проверкой концепции, предназначенной для демонстрации возможностей следования инструкциям недавно выпущенных базовых моделей. > Он оптимизирован для участия в разговоре, но НЕ согласован с RLHF для фильтрации или предотвращения деликатных тем. > В результате может создаваться вредный или неприемлемый контент. > Команда активно работает над повышением своей эффективности посредством дальнейшего обучения и согласования с методами RL. Предварительное обучение проводилось с использованием NeMo Framework от NVIDIA, который использует PyTorch Lightning для…

Модальности:
Генерация текста

Области применения:
Генерация кода Диалог / чат Следование инструкциям


Задача: Генерация текста
Автор: BSC-LT
Теги: llama, conversational, bg, ca, code, cs, cy, da
Лайков: 27  |  Загрузок: 3,351

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.