[Phi-4-QwQ уточненный] от Microsoft Phi-4 — это современная открытая модель, разработанная с упором на ответственное решение проблем и расширенные возможности рассуждения. Основанный на разнообразном сочетании синтетических наборов данных, тщательно отфильтрованных общедоступных веб-сайтов, а также высококачественных научных книгах и наборах данных вопросов и ответов, Phi-4-QwQ гарантирует, что небольшие, способные модели обучаются с использованием наборов данных исключительной глубины и точности. Phi-4-QwQ применяет надежный подход к обеспечению безопасности после обучения с использованием наборов синтетических данных с открытым исходным кодом и собственных синтетических данных. Это предполагает сочетание методов SFT (контролируемая точная настройка) и итеративных методов DPO (прямая оптимизация предпочтений), обеспечивающих полезные и безвредные результаты в различных категориях безопасности. Для взаимодействия в стиле чата используйте tokenizer.applychattemplate: Phi-4-QwQ предназначен для широкого спектра приложений, особенно тех, которые требуют расширенного мышления, многоязычных возможностей и ответственного решения проблем. Основные варианты использования включают в себя: 1. Ответственное решение проблем — разбиение сложных проблем на логические и практические шаги. — Предложение этических, всесторонних решений в академическом и профессиональном контексте. 2. Продвинутые задачи на рассуждение. Превосходство в…
Модальности:
Генерация текста
Области применения:
Диалог / чат
Задача: Генерация текста
Автор: prithivMLmods
Теги: llama, text-generation-inference, phi3, phi, conversational, en, endpoints_compatible
Лайков: 11 | Загрузок: 12
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.