facebook/galactica-120b - Каталог нейросетей
Генерация текста

facebook/galactica-120b

Добавлено:
facebook/galactica-120b

Следуя Митчеллу и др. (2018), эта карточка модели предоставляет информацию о модели GALACTICA, о том, как она была обучена, и предполагаемых вариантах использования. Полную информацию о том, как модель обучалась и оценивалась, можно найти в релизном документе. Эта контрольная точка модели была интегрирована в Хаб Мануэлем Ромеро. Модели GALACTICA обучаются на крупномасштабном научном корпусе. Модели предназначены для выполнения научных задач, включая, помимо прочего, прогнозирование цитирования, научный контроль качества, математические рассуждения, обобщение, генерацию документов, прогнозирование молекулярных свойств и извлечение сущностей. Модели были разработаны командой Papers with Code в Meta AI для изучения использования языковых моделей для автоматической организации науки. Мы обучаем модели размером от 125M до 120B параметров. Ниже приводится краткое описание выпущенных моделей: Архитектура на основе трансформатора в конфигурации только для декодера с некоторыми модификациями (более подробную информацию см. В статье). Основными предполагаемыми пользователями моделей GALACTICA являются исследователи, изучающие языковые модели, применяемые в научной области. Мы также ожидаем, что модель будет полезна разработчикам, желающим создавать научные инструменты.…

Модальности:
Генерация текста


Задача: Генерация текста
Автор: facebook
Теги: opt, galactica, text-generation-inference
Лайков: 158  |  Загрузок: 1,393

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.