У нас есть бесплатный блокнот Google Colab для превращения Llama 3.1 (8B) в модель рассуждения: https://colab.research.google.com/github/unslothai/notebooks/blob/main/nb/Llama3.1_(8B)-GRPO.ipynb Все блокноты удобны для начинающих! Добавьте свой набор данных, нажмите «Запустить все», и вы получите в 2 раза более быструю точно настроенную модель, которую можно экспортировать в GGUF, vLLM или загрузить в Hugging Face. — Этот разговорный блокнот Llama 3.2 (Conversational.ipynb) полезен для шаблонов ShareGPT ChatML/Vicuna. — Этот блокнот для завершения текста — TextCompletion.ipynb) предназначен для необработанного текста. Этот блокнот DPO копирует Zephyr. — Kaggle имеет 2x T4, но мы используем 1. Из-за накладных расходов 1x T4 работает в 5 раз быстрее. Ссылка на блог: https://perplexity.ai/hub/blog/open-source-r1-1776 R1 1776 — это модель рассуждения DeepSeek-R1, которая прошла обучение с помощью искусственного интеллекта Perplexity для устранения цензуры Коммунистической партии Китая. Модель предоставляет объективную, точную и фактическую информацию, сохраняя при этом высокие способности к рассуждению. Чтобы гарантировать, что наша модель останется полностью «не подвергнутой цензуре» и сможет охватывать широкий спектр деликатных тем, мы подготовили разнообразный многоязычный оценочный набор из более чем 1000 примеров, которые всесторонне охватывают такие темы…
Модальности:
Генерация текста
Области применения:
Диалог / чат
Задача: Генерация текста
Автор: unsloth
Теги: gguf, llama, deepseek, deepseek_v3, unsloth, en, endpoints_compatible, conversational
Лайков: 24 | Загрузок: 251
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.