Krystalan/DRT-7B - Каталог нейросетей
Генерация текста

Krystalan/DRT-7B

Добавлено:
Krystalan/DRT-7B

🤗 ДРТ-7Б&nbsp&nbsp | &nbsp&nbsp🤗 ДРТ-8Б&nbsp&nbsp | &nbsp&nbsp🤗 ДРТ-14Б&nbsp&nbsp | &nbsp&nbsp 📑 Статья Этот репозиторий содержит ресурсы для нашей статьи «DRT: перевод глубоких рассуждений с помощью длинной цепочки мыслей». Если вы считаете эту работу полезной, пожалуйста, рассмотрите возможность процитировать нашу статью: — Введение — Модели — Доступ к модели — Производительность модели — Подсказки модели — Быстрый старт — Примеры перевода — Данные — Лицензия В этой работе мы представляем DRT, попытку применить успех долгосрочных рассуждений к нейронному машинному переводу (MT). С этой целью — 🌟 Мы собираем английские предложения со сравнениями или метафорами из существующих литературных книг, которые подходят для перевода путем долгого размышления. — 🌟 Мы предлагаем разработанную мультиагентную структуру с тремя агентами (т. е. переводчиком, консультантом и оценщиком) для долговременного синтеза образцов MT. Всего синтезировано 22 264 образца. — 🌟 Мы тренируем DRT-8B, DRT-7B и DRT-14B, используя в качестве магистралей Llama-3.1-8B-Instruct, Qwen2.5-7B-Instruct и Qwen2.5-14B-Instruct. > Наша цель не состоит в том, чтобы достичь конкурентоспособной производительности с O1 OpenAI в области нейронного машинного перевода (MT). Вместо этого мы исследуем технические пути, чтобы добиться успеха в долгосрочных…

Модальности:
Генерация текста

Области применения:
Диалог / чат


Задача: Генерация текста
Автор: Krystalan
Теги: qwen2, machine tranlsation, O1-like model, Chat, conversational, en, zh
Лайков: 14  |  Загрузок: 27

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.