DeepSeek-V2.5-1210 — это обновленная версия DeepSeek-V2.5 с улучшениями по различным возможностям: — Математические: производительность в тесте MATH-500 улучшилась с 74,8% до 82,8%. — Кодирование: точность в тесте LiveCodebench (08.01 — 12.01) выросла с 29,2% до 34,38%. — Письмо и рассуждение: Соответствующие улучшения наблюдались во внутренних тестовых наборах данных. Кроме того, в новой версии модели оптимизирован пользовательский интерфейс для функций загрузки файлов и обобщения веб-страниц. Чтобы использовать DeepSeek-V2.5 в формате BF16 для вывода моделей, требуются графические процессоры 80 ГБ8.** Вы можете напрямую использовать трансформаторы Huggingface для вывода моделей. Полный шаблон чата можно найти в файле tokenizerconfig.json, расположенном в репозитории модели Huggingface. Чтобы использовать vLLM для вывода модели, объедините этот запрос на включение в свою кодовую базу vLLM: https://github.com/vllm-project/vllm/pull/4650. Вызов функций позволяет модели вызывать внешние инструменты для расширения ее возможностей. json { «name»: «getcurrentweather», «description»: «Получить текущую погоду в заданном месте», «parameters»: { «type»: «object», «properties»: { «location»: { «type»:…
Модальности:
Генерация текста
Области применения:
Диалог / чат
Задача: Генерация текста
Автор: deepseek-ai
Теги: deepseek_v2, conversational, custom_code, text-generation-inference, endpoints_compatible
Лайков: 256 | Загрузок: 642
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.