Метка: deepseek_v2

Генерация текста

Kwaipilot/KwaiCoder-DS-V2-Lite-Base

Kwai-Coder-DS-V2-Lite-Base построен на основе Deepseek-v2-Lite-Base, который имеет в общей сложности 16B параметров и 2,4B активированных параметров. Он поддерживает...

Генерация текста

RedHatAI/DeepSeek-Coder-V2-Instruct-FP8

— Архитектура модели: DeepSeek-Coder-V2-Instruct — Входные данные: текст — Выходные данные: текст — Оптимизация модели: — Весовое квантование:...

Генерация текста

TechxGenus/DeepSeek-Coder-V2-Lite-Instruct-AWQ

Квантованная версия AWQ модели DeepSeek-Coder-V2-Lite-Instruct. —————————: | :—————: | :—————-: | :—————-: | :————————————————————: | Вы можете пообщаться...

Генерация текста

casperhansen/deepseek-coder-v2-instruct-awq

Эта модель была квантована на 4x A100 по 80 ГБ с системной оперативной памятью 1 ТБ. Он был...

Генерация текста

RedHatAI/DeepSeek-Coder-V2-Lite-Instruct-FP8

— Архитектура модели: DeepSeek-Coder-V2-Lite-Instruct — Входные данные: текст — Выходные данные: текст — Оптимизация модели: — Весовое квантование:...

Генерация текста

hpcgroup/hpc-coder-v2-16b

Модель HPC-Coder-v2-16b представляет собой LLM-код HPC, настроенный на наборе данных инструкций и отвечающий общим темам HPC, таким как...

Генерация текста

Ванильная модель, используемая в нашей исследовательской статье Expert-Specialized Fine-Tuning (ESFT): https://arxiv.org/abs/2407.01906. Чтобы использовать эту модель и специализированные экспертные...

Генерация текста

deepseek-ai/DeepSeek-Coder-V2-Base

Мы представляем DeepSeek-Coder-V2, модель языка кода Mixture-of-Experts (MoE) с открытым исходным кодом, которая обеспечивает производительность, сравнимую с GPT4-Turbo,...

Генерация текста

deepseek-ai/DeepSeek-Coder-V2-Lite-Base

Мы представляем DeepSeek-Coder-V2, модель языка кода Mixture-of-Experts (MoE) с открытым исходным кодом, которая обеспечивает производительность, сравнимую с GPT4-Turbo,...

Генерация текста

deepseek-ai/DeepSeek-Coder-V2-Instruct-0724

Мы представляем DeepSeek-Coder-V2, модель языка кода Mixture-of-Experts (MoE) с открытым исходным кодом, которая обеспечивает производительность, сравнимую с GPT4-Turbo,...