KwaiCoder-DS-V2-Lite-Base
Kwai-Coder-DS-V2-Lite-Base построен на основе Deepseek-v2-Lite-Base, который имеет в общей сложности 16B параметров и 2,4B активированных параметров. Он поддерживает...
Kwai-Coder-DS-V2-Lite-Base построен на основе Deepseek-v2-Lite-Base, который имеет в общей сложности 16B параметров и 2,4B активированных параметров. Он поддерживает...
— Архитектура модели: DeepSeek-Coder-V2-Instruct — Входные данные: текст — Выходные данные: текст — Оптимизация модели: — Весовое квантование:...
Квантованная версия AWQ модели DeepSeek-Coder-V2-Lite-Instruct. —————————: | :—————: | :—————-: | :—————-: | :————————————————————: | Вы можете пообщаться...
Эта модель была квантована на 4x A100 по 80 ГБ с системной оперативной памятью 1 ТБ. Он был...
— Архитектура модели: DeepSeek-Coder-V2-Lite-Instruct — Входные данные: текст — Выходные данные: текст — Оптимизация модели: — Весовое квантование:...
Модель HPC-Coder-v2-16b представляет собой LLM-код HPC, настроенный на наборе данных инструкций и отвечающий общим темам HPC, таким как...
Ванильная модель, используемая в нашей исследовательской статье Expert-Specialized Fine-Tuning (ESFT): https://arxiv.org/abs/2407.01906. Чтобы использовать эту модель и специализированные экспертные...
Мы представляем DeepSeek-Coder-V2, модель языка кода Mixture-of-Experts (MoE) с открытым исходным кодом, которая обеспечивает производительность, сравнимую с GPT4-Turbo,...
Мы представляем DeepSeek-Coder-V2, модель языка кода Mixture-of-Experts (MoE) с открытым исходным кодом, которая обеспечивает производительность, сравнимую с GPT4-Turbo,...
Мы представляем DeepSeek-Coder-V2, модель языка кода Mixture-of-Experts (MoE) с открытым исходным кодом, которая обеспечивает производительность, сравнимую с GPT4-Turbo,...