unsloth/SmolLM2-135M - Каталог нейросетей
Генерация текста

unsloth/SmolLM2-135M

Добавлено:
unsloth/SmolLM2-135M

У нас есть бесплатный ноутбук Google Colab Tesla T4 для Llama 3.2 (3B) здесь: https://colab.research.google.com/drive/1Ys44kVvmeZtnICzWz0xgpRnrIOjZAuxp?usp=sharing Для получения более подробной информации о модели перейдите на карточку оригинальной модели Hugging Face. Все ноутбуки удобны для начинающих! Добавьте свой набор данных, нажмите «Запустить все», и вы получите в 2 раза более быструю точно настроенную модель, которую можно экспортировать в GGUF, vLLM или загрузить в Hugging Face. — Этот диалоговый блокнот полезен для шаблонов ShareGPT ChatML/Vicuna. — Этот блокнот для завершения текста предназначен для необработанного текста. Этот блокнот DPO копирует Zephyr. — * В Kaggle есть 2 T4, но мы используем 1. Из-за накладных расходов 1 T4 работает в 5 раз быстрее. Огромное спасибо команде Hugging Face за создание и выпуск этих моделей. SmolLM2 — это семейство компактных языковых моделей, доступных в трех размерах: параметры 135M, 360M и 1,7B. Они способны решать широкий спектр задач, будучи при этом достаточно легкими для запуска на устройстве. Вариант 1.7B демонстрирует значительные преимущества по сравнению со своим предшественником SmolLM1-1.7B, особенно в выполнении инструкций, знаниях, рассуждениях и математике. Он был обучен на 11 триллионах токенов с использованием разнообразной комбинации наборов данных: FineWeb-Edu,…

Модальности:
Генерация текста


Задача: Генерация текста
Автор: unsloth
Теги: llama, unsloth, en, text-generation-inference, endpoints_compatible
Лайков: 7  |  Загрузок: 832

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.