RedHatAI/Meta-Llama-3.1-8B-Instruct-quantized.w8a8

— Архитектура модели: Meta-Llama-3 — Входные данные: текст — Выходные данные: текст — Оптимизация модели: — Квантование активации: INT8 — Квантование веса: INT8 — Варианты предполагаемого использования: Предназначен для коммерческого и исследовательского использования нескольких языков. Как и Meta-Llama-3.1-8B-Instruct, эта модель предназначена для общения в режиме помощника. — За пределами области применения: использование любым способом, нарушающим применимые законы и правила (включая законы о торговом регулировании). — Дата выпуска: 11.07.2024 — Версия: 1.0 — Проверено на: RHOAI 2.20, RHAIIS 3.0, RHELAI 1.5 — Лицензии: Llama3.1 — Разработчики модели: Neural Magic Эта модель представляет собой квантованную версию Meta-Llama-3.1-8B-Instruct. Он оценивался по нескольким задачам для оценки его качества по сравнению с некваватизированной моделью, включая множественный выбор, математические рассуждения и генерацию открытого текста. Meta-Llama-3.1-8B-Instruct-quantized.w8a8 достигает 105,4% восстановления для оценки Arena-Hard, 100,3% для OpenLLM v1 (с использованием подсказок Meta, если они доступны), 101,5% для OpenLLM v2, 99,7% для HumanEval pass@1 и 98,8% для HumanEval+ pass@1. Эта модель была получена путем квантования весов Meta-Llama-3.1-8B-Instruct к типу данных INT8. Эта оптимизация уменьшает…

Модальности:
Генерация текста

Области применения:
Диалог / чат Следование инструкциям

Задача: Генерация текста
Автор: RedHatAI
Теги: llama, facebook, meta, llama-3, int8, vllm, chat, neuralmagic
Лайков: 20 | Загрузок: 9,293

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.

Похожие модели (Генерация текста)

cerebras/MiniMax-M2.5-REAP-172B-A10B

nvidia/Nemotron-Research-Reasoning-Qwen-1.5B

internlm/internlm2-chat-7b-sft

UnfilteredAI/NSFW-flash