Этот репозиторий содержит модель Qwen3-30B-A3B-MegaScience, модель Qwen3-30B-A3B-Base, точно настроенную на наборе данных MegaScience для научных рассуждений. Научное мышление имеет решающее значение для развития ученых, занимающихся искусственным интеллектом, и поддержки исследователей-людей в расширении границ естественнонаучных открытий. Однако сообщество открытого исходного кода в первую очередь сосредоточилось на математике и программировании, игнорируя при этом научную область, во многом из-за отсутствия открытых, крупномасштабных, высококачественных и поддающихся проверке наборов данных для научных рассуждений. Чтобы восполнить этот пробел, мы сначала представляем TextbookReasoning, открытый набор данных, содержащий правдивые справочные ответы, извлеченные из 12 тысяч научных учебников университетского уровня, включающий 650 тысяч вопросов для рассуждения, охватывающих 7 научных дисциплин. Далее мы представляем MegaScience, крупномасштабную смесь высококачественных наборов данных с открытым исходным кодом, насчитывающую 1,25 миллиона экземпляров, разработанную на основе систематических исследований абляции, которые оценивают различные методологии отбора данных для определения оптимального подмножества для каждого общедоступного набора научных данных. Тем временем мы создаем комплексную систему оценки, охватывающую различные предметы и типы вопросов по 15 критериям,…
Модальности:
Генерация текста
Области применения:
Диалог / чат
Задача: Генерация текста
Автор: MegaScience
Теги: qwen3_moe, conversational, en, endpoints_compatible
Лайков: 10 | Загрузок: 97
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.