ELYZA-Thinking-1.0-Qwen-32B — это модель рассуждения, обученная ELYZA, Inc. Основанная на Qwen/Qwen2.5-32B-Instruct, эта модель прошла постобучение для улучшения ее возможностей рассуждения на японском языке (построено с помощью Qwen). На этапе после обучения модель обучалась посредством имитационного обучения с использованием синтетических данных, включающих длинные цепочки мыслей (CoT), которые были сгенерированы с помощью алгоритма поиска по дереву Монте-Карло (MCTS). Для получения более подробной информации, пожалуйста, обратитесь к нашему сообщению в блоге. Вы можете использовать модель с библиотекой Hugging Face Transformers. Следующий код представляет собой пример использования модели для вывода. Для развертывания vLLM рекомендуется создать OpenAI-совместимый сервер. > [!Tip] > Мы рекомендуем установить температуру в диапазоне от 0,5 до 0,7 и использовать значение topp` 0,95, чтобы модель не попадала в повторяющиеся циклы.
Модальности:
Генерация текста
Области применения:
Диалог / чат
Задача: Генерация текста
Автор: elyza
Теги: qwen2, conversational, ja, en, text-generation-inference, endpoints_compatible
Лайков: 10 | Загрузок: 135
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.