DavidAU/DeepThought-MOE-8X3B-R1-Llama-3.2-Reasoning-18B-gguf

Прототип: Модель Deep Reasoning 8X3B Llama 3.2 MOE (всего 24B параметров). Это модель 8X3B, смесь экспертов с активированными 4/8 экспертами (8 тонких настроек Llama 3.2), все с установленной технологией Reasoning (в каждой), что дает вам модель параметров 24B (8X3B) только с размером модели 18,4B. Эта модель состоит из ВОСЕМЬ точно настроенных моделей Llama 3.2 3B для рассуждений/мыслей. Эту модель можно использовать для творческих, нетворческих случаев и общего использования. Три примера подсказок с выводом размещены внизу этой страницы. Это очень стабильная модель, которая может работать при температуре 1+ 2+ и выше и генерировать связные мысли и превосходит многие другие «модели мышления» с точки зрения производительности, связности и глубины мысли, включая рассуждения с длинным ходом мыслей. Вы можете выбрать/установить количество экспертов для использования от 1 до 8. Эта модель предназначена для всех случаев использования и имеет немного более логичный подход к решению проблем, чем стандартная модель. Эту модель также можно использовать для решения логических головоломок, загадок и других задач с помощью усовершенствованных систем «мышления» DeepSeek. Эта модель также может решать проблемы/загадки/головоломки, которые обычно выходят за рамки возможностей модели Ламы 3.1 или модели Ламы 3.2.…

Модальности:
Генерация текста

Области применения:
Логика и рассуждение Диалог / чат

Задача: Генерация текста
Автор: DavidAU
Теги: gguf, Prototype, 8X3B MOE, mixture of experts, reasoning, thinking, thoughts, deepseek
Лайков: 8 | Загрузок: 78

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

TheBloke/h2ogpt-gm-oasst1-en-2048-falcon-40b-v2-GPTQ

bullerwins/Meta-Llama-3.1-70B-Instruct-GGUF

medicalai/MedFound-176B

openlm-research/open_llama_7b_v2