dphn/dolphin-2.9.1-mixtral-1x22b

Курируют и обучают Эрик Хартфорд, Лукас Аткинс и Фернандо Фернандес, а также компания Cognitive Computations. Эта модель основана на Dolphin-2.9-Mixtral-8x22b и имеет лицензию Apache-2.0. Базовая модель имеет контекст размером 64 КБ, а полная точная настройка осуществлялась с длиной последовательности 16 КБ. Модель представляет собой эксперт, извлеченный с использованием SLERP и специального сценария, исходный код которого мы открыли. Он извлекает один эксперт, который представляет собой объединенный SLERP всех 8 экспертов архитектуры Mixtral. Мы решили не полностью переходить к плотной модели, чтобы попытаться сохранить как можно большую часть производительности исходной модели, поскольку этот процесс уже достаточно хирургический и необходимо учитывать множество переменных. Дельфин-2.9 обладает разнообразными навыками обучения, общения и программирования. Он также имеет начальные агентные способности и поддерживает вызов функций. Дельфин без цензуры. Мы отфильтровали набор данных, чтобы удалить выравнивание и предвзятость. Это делает модель более совместимой. Прежде чем предоставлять модель как услугу, рекомендуется реализовать собственный уровень выравнивания. Он будет очень услужлив к любым просьбам, даже неэтичным. Пожалуйста, прочитайте мой пост в блоге о моделях без цензуры.…

Модальности:
Генерация текста

Области применения:
Диалог / чат

Задача: Генерация текста
Автор: dphn
Теги: mixtral, generated_from_trainer, axolotl, conversational, en, text-generation-inference, endpoints_compatible
Лайков: 45 | Загрузок: 9,110

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

bartowski/zai-org_GLM-4.7-Flash-GGUF

maldv/Awqward2.5-32B-Instruct

lucyknada/microsoft_WizardLM-2-7B

litert-community/TranslateGemma-4B-IT