tiiuae/Falcon3-3B-Instruct - Каталог нейросетей
Генерация текста

tiiuae/Falcon3-3B-Instruct

Добавлено:
tiiuae/Falcon3-3B-Instruct

Семейство моделей открытого фундамента Falcon3 представляет собой набор предварительно обученных и инструктирующих LLM с параметрами от 1B до 10B. Falcon3-3B-Instruct достигает хороших результатов в рассуждении, понимании языка, выполнении инструкций, кодировании и математических задачах. Falcon3-3B-Instruct поддерживает 4 языка (английский, французский, испанский, португальский) и длину контекста до 32 КБ. — Архитектура — Архитектура причинного декодера на основе преобразователя — 22 блока декодера — Внимание к групповым запросам (GQA) для более быстрого вывода: 12 головок запроса и 4 головки значений ключа — Более широкий размер головки: 256 — Высокое значение RoPE для поддержки понимания длинного контекста: 1000042 — Использует SwiGLU и RMSNorm — Длина контекста 32 КБ — Размер словаря 131 КБ — Урезано и исправлено из Falcon3-7B-Base всего на 100 гигатокенах наборов данных, включающих веб-данные, коды, STEM, высококачественные и многоязычные данные с использованием 1024 чипов графического процессора H100. — Посттренинг на 1,2 миллионах образцов STEM, диалоговых данных, кода, данных безопасности и вызовов функций. — Поддерживает EN, FR, ES, PT. — Разработано Институтом технологических инноваций. — Лицензия: TII Falcon-LLM License 2.0. — Дата выпуска модели: декабрь 2024 г. В следующей таблице мы приводим наши внутренние контрольные показатели конвейера. — Мы используем…

Модальности:
Генерация текста

Области применения:
Диалог / чат Следование инструкциям


Задача: Генерация текста
Автор: tiiuae
Теги: llama, falcon3, conversational, en, fr, es, pt, text-generation-inference
Лайков: 28  |  Загрузок: 8,456

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.