elyza/ELYZA-Thinking-1.0-Qwen-32B

ELYZA-Thinking-1.0-Qwen-32B — это модель рассуждения, обученная ELYZA, Inc. Основанная на Qwen/Qwen2.5-32B-Instruct, эта модель прошла постобучение для улучшения ее возможностей рассуждения на японском языке (построено с помощью Qwen). На этапе после обучения модель обучалась посредством имитационного обучения с использованием синтетических данных, включающих длинные цепочки мыслей (CoT), которые были сгенерированы с помощью алгоритма поиска по дереву Монте-Карло (MCTS). Для получения более подробной информации, пожалуйста, обратитесь к нашему сообщению в блоге. Вы можете использовать модель с библиотекой Hugging Face Transformers. Следующий код представляет собой пример использования модели для вывода. Для развертывания vLLM рекомендуется создать OpenAI-совместимый сервер. > [!Tip] > Мы рекомендуем установить температуру в диапазоне от 0,5 до 0,7 и использовать значение topp` 0,95, чтобы модель не попадала в повторяющиеся циклы.

Модальности:
Генерация текста

Области применения:
Диалог / чат

Задача: Генерация текста
Автор: elyza
Теги: qwen2, conversational, ja, en, text-generation-inference, endpoints_compatible
Лайков: 10 | Загрузок: 135

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

Генерация текста

Похожие модели (Генерация текста)

Brooooooklyn/Qwen3.6-27B-UD-Q6_K_XL-mlx

nvidia/NVIDIA-Nemotron-Nano-9B-v2-FP8

NeuralNovel/Llama-3-NeuralPaca-8b

QuantFactory/Qwen2.5-Coder-7B-GGUF