qingy2024/HRM-Text1-41M

HRM-Text1 — это экспериментальная архитектура генерации текста, основанная на архитектуре модели иерархического рассуждения (HRM). Я добавил в модель позиционные внедрения для каждого токена и немного подправил обучающий код их реализации, чтобы генерация текста работала хорошо. Он был обучен с нуля на наборе данных roneneldan/TinyStories и может создавать… скажем так, полусвязные предложения;) Модель использует структуру HRM, состоящую из модуля «Специалист» для низкоуровневой обработки и модуля «Менеджер» для абстракции и планирования высокого уровня. Эта архитектура призвана более эффективно обрабатывать долгосрочные зависимости путем суммирования информации в разных временных масштабах. — Архитектура: модель иерархического рассуждения (HRM) — Данные обучения: roneneldan/TinyStories — Исходный документ: модель иерархического рассуждения — Исходный код/код модели: qingy1337/HRM-Text — Токенизатор: токенизатор T5 — Цель: моделирование причинного языка Вот несколько примеров выходных данных модели (она довольно быстро темнеет, понятия не имею, почему, ха-ха). Модель: Жила-была маленькая девочка по имени Лили. Она любила играть со своими игрушками и друзьями. Однажды Лили и ее друзья пошли в…

Модальности:
Генерация текста

Задача: Генерация текста
Автор: qingy2024
Теги: hrm, tinystories, experimental, causal-lm, en
Лайков: 32 | Загрузок: 0

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

reach-vb/Meta-Llama-3.1-8B-Instruct-Q6_K-GGUF

TheBloke/speechless-mistral-dolphin-orca-platypus-samantha-7B-GGUF

yentinglin/Taiwan-LLM-7B-v2.0-chat

psymon/KoLlama2-7b