unsloth/r1-1776-distill-llama-70b-GGUF

У нас есть бесплатный блокнот Google Colab для превращения Llama 3.1 (8B) в модель рассуждения: https://colab.research.google.com/github/unslothai/notebooks/blob/main/nb/Llama3.1_(8B)-GRPO.ipynb Все блокноты удобны для начинающих! Добавьте свой набор данных, нажмите «Запустить все», и вы получите в 2 раза более быструю точно настроенную модель, которую можно экспортировать в GGUF, vLLM или загрузить в Hugging Face. — Этот разговорный блокнот Llama 3.2 (Conversational.ipynb) полезен для шаблонов ShareGPT ChatML/Vicuna. — Этот блокнот для завершения текста — TextCompletion.ipynb) предназначен для необработанного текста. Этот блокнот DPO копирует Zephyr. — Kaggle имеет 2x T4, но мы используем 1. Из-за накладных расходов 1x T4 работает в 5 раз быстрее. Ссылка на блог: https://perplexity.ai/hub/blog/open-source-r1-1776 R1 1776 — это модель рассуждения DeepSeek-R1, которая прошла обучение с помощью искусственного интеллекта Perplexity для устранения цензуры Коммунистической партии Китая. Модель предоставляет объективную, точную и фактическую информацию, сохраняя при этом высокие способности к рассуждению. Чтобы гарантировать, что наша модель останется полностью «не подвергнутой цензуре» и сможет охватывать широкий спектр деликатных тем, мы подготовили разнообразный многоязычный оценочный набор из более чем 1000 примеров, которые всесторонне охватывают такие темы…

Модальности:
Генерация текста

Области применения:
Диалог / чат

Задача: Генерация текста
Автор: unsloth
Теги: gguf, llama, deepseek, deepseek_v3, unsloth, en, endpoints_compatible, conversational
Лайков: 24 | Загрузок: 251

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

sbintuitions/sarashina2.2-0.5b-instruct-v0.1

giux78/zefiro-7b-beta-ITA-v0.1

fava-uw/fava-model

deepnight-research/saily_100b