RefalMachine/RuadaptQwen2.5-1.5B-instruct - Каталог нейросетей
Генерация текста

RefalMachine/RuadaptQwen2.5-1.5B-instruct

Добавлено:
RefalMachine/RuadaptQwen2.5-1.5B-instruct

Инструктивная версия адаптированной на русском языке модели Qwen2.5-1.5B. В модели был заменен токенизатор, затем произведено дообучение (Продолжение предварительного обучения) на русскоязычном корпусе, после чего была применена техника LEP (Распространение встраивания знаний, статья скоро будет). Благодаря новому токенизатору (расширенный tiktoken cl100k с униграмом токенизатора на 48 т. токенов) скорость генерации* русскоязычных текстов возрасла до 60% по сравнению с исходной моделью Qwen-2.5-1.5B-Instruct. *Под ускорением генерации подразумевается количество русскоязычных символов/слов в секунду на одинаковых текстовых последовательностях. Модель можно попробовать в поднятом пространстве (внизу в поле выбора модели): https://huggingface.co/spaces/RefalMachine/RuadaptQwen2.5 Замеры были произведены с использованием официального кода лидерборда (https://github.com/VikhrModels/rullmarena), но с повторением=1.1**. Тихомиров М., Чернышев Д. Содействие адаптации большой языковой модели к русскому языку с помощью Learned Embedding Propagation // 2024 (Препринт: https://arxiv.org/abs/2412.21140) Тихомиров М., Чернышев Д. Влияние токенизации на русскую адаптацию LLaMa //2023 Иванников Испрас Открыть…

Модальности:
Генерация текста

Области применения:
Диалог / чат Следование инструкциям


Задача: Генерация текста
Автор: RefalMachine
Теги: qwen2, conversational, ru
Лайков: 8  |  Загрузок: 91

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.