CodeDevX/Vibe-Coding-Instruct

— Цель: описать концептуальный дизайн и логику обучения языковой модели, используемой в этом репозитории (Vibe-Coding-Instruct). — Область применения: основное внимание уделяется архитектуре модели, целям обучения, роли токенизатора, потоку данных и концепции вывода — никаких подробностей реализации или команд. — Архитектура: причинный (авторегрессивный) преобразователь, который прогнозирует следующий токен с учетом предыдущего контекста. Модель сопоставляет последовательности токенов с условными распределениями вероятностей: — Вперед: для токенов $x{1..T}$ модель вычисляет $ptheta(xt mid x{ — Цель: максимальное правдоподобие/перекрестная энтропия для прогнозирования следующего токена. Потери при обучении представляют собой отрицательную логарифмическую вероятность, суммированную по позициям: — Роль: преобразование необработанного текста в дискретные идентификаторы токенов, которые использует модель. Токенизация влияет на длину последовательности, размер словаря и сегментацию программирования и инструкций. текст — Поведение: использует токенизатор подслов (подобный BPE/WordPiece), обученный на корпусе, чтобы сбалансировать компактность и выразительность словаря. — Специальные токены: маркеры, специфичные для инструкции/модели (например, BOS, EOS, заполнение), создают примеры и границы генерации элементов управления. — Пример конструкции: каждый обучающий образец представляет собой конкатенацию…

Модальности:
Генерация текста

Области применения:
Следование инструкциям

Задача: Генерация текста
Автор: CodeDevX
Теги: gpt2, custom, vibecodinginstruct, en, text-generation-inference, endpoints_compatible
Лайков: 7 | Загрузок: 368

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

LiquidAI/LFM2.5-1.2B-Instruct-MLX-8bit

NousResearch/Redmond-Puffin-13B

AI4Chem/ChemLLM-7B-Chat-1_5-DPO

aisquared/dlite-v2-774m