Vanessasml/cyber-risk-llama-3-8b - Каталог нейросетей
Генерация текста

Vanessasml/cyber-risk-llama-3-8b

Добавлено:
Vanessasml/cyber-risk-llama-3-8b

Эта модель представляет собой доработанную версию мета-ламы/Мета-Лламы-3-8B в наборе выходных данных vanessasml/cybersecurity32kinstructioninputoutout. Он специально разработан для повышения эффективности создания и понимания кибербезопасности, выявления киберугроз и классификации данных в соответствии с таксономией NIST и ИТ-рисками на основе руководящих принципов ITC EBA. — Предполагаемые пользователи: исследователи данных и разработчики, работающие над приложениями кибербезопасности. — Случаи использования, выходящие за рамки области применения: эту модель не следует использовать для медицинских консультаций, юридических решений или любых жизненно важных систем. Модель была доработана на базе данных vanessasml/cybersecurity32kinstructioninputoutput, ориентированной на анализ новостей в области кибербезопасности. Специальный формат данных не применялся, как рекомендовано. Предварительная обработка: текстовые данные были токенизированы с использованием токенизатора, соответствующего базовой модели мета-лама/Мета-Ллама-3-8B. — Аппаратное обеспечение: обучение проводилось на графических процессорах с включенной смешанной точностью (FP16/BF16). — Оптимизатор: постраничный AdamW с графиком скорости обучения косинуса. — Эпохи: модель обучалась в течение 1 эпохи. — Размер пакета: 4 на устройство, с градиентным накоплением, где это необходимо. Оценка модели основывалась на качественной оценке сгенерированного текста…

Модальности:
Генерация текста

Области применения:
Диалог / чат Финансы


Задача: Генерация текста
Автор: Vanessasml
Теги: llama, finance, supervision, cyber risk, cybersecurity, cyber threats, SFT, LoRA
Лайков: 15  |  Загрузок: 870

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.