Метка: custom_code

Генерация текста

jondurbin/airoboros-jamba-3-3

Другая экспериментальная модель, использующая в основном синтетические данные, сгенерированные airoboros. Базовая модель jamba-v0.1 предположительно имеет длину контекста 256...

Генерация текста

leeroo/LeerooDedicated-Math-7b

Модель построена с применением Orchestration of Expert для математической области. Специальная модель либо генерирует решения, либо, при необходимости,...

Генерация текста

LnL-AI/dbrx-base-converted-v2

Конвертированная модель на основе кода fahadh4ilyas. Версия 2 имеет другой макет с разделением Wqkv. 2. Настоятельно рекомендуется обучить...

Генерация текста

v2ray/dbrx-base-fixed

Исходный код реализации DBRX содержит несколько ошибок, влияющих только на обучение, которые я исправил в этой повторной загрузке....

Генерация текста

Crystalcareai/GemMoE-Medium-V0.5

Модель генерации текста Модальности:Генерация текста Задача: Генерация текста Автор: Crystalcareai Теги: gemmoe, custom_codeЛайков: 6 | Загрузок: 6 Открыть...

Генерация текста

winglian/mistral-denseformer-7b

Это реализация Mistral-7B-v0.1 в DenseFormer. Подробности о DenseFormer описаны в статье. Для загрузки этой модели вам нужно будет...

Генерация текста

> вес исходного pth из https://huggingface.co/BlinkDL/rwkv-6-world/blob/main/RWKV-x060-World-1B6-v2.1-20240328-ctx4096.pth. Модальности:Генерация текста Задача: Генерация текста Автор: RWKV Теги: rwkv6, custom_codeЛайков: 6 | ...

Генерация текста

Syed-Hasan-8503/phi-2-ORPO

Phi-2-ORPO — это доработанная версия microsoft/phi-2 на наборе данных предпочтений argilla/dpo-mix-7k с использованием оптимизации предпочтений соотношения шансов (ORPO)....

Генерация текста

llmware/slim-sa-ner

slim-sa-ner объединяет две наиболее популярные традиционные функции классификатора (анализ настроений и распознавание именованных объектов) и переосмысливает их как...

Генерация текста

llmware/slim-xsum

slim-xsum реализует функцию «экстремального суммирования» в виде вызова функции в LLM на основе декодера, который генерирует на выходе...