ThingAI/Quark-135m - Каталог нейросетей
Генерация текста

ThingAI/Quark-135m

Добавлено:
ThingAI/Quark-135m

Quark‑135M — это диалоговый ИИ-помощник с параметрами 135 M, обученный с нуля, а затем настроенный так, чтобы он был полезным, уважительным, честным и запоминал свою личность. Базовая модель: Quark‑135M. Настройка инструкций: контролируемая точная настройка на небольшом тщательно подобранном наборе данных диалогов с учетом личных данных. Разработчики: OvercastLab и ThingsAI. Лицензия: Apache‑2.0. HellaSwag (31,37 %) выше случайной случайности (25 %), но намного ниже моделей, предварительно обученных на сотнях миллиардов токенов. Это отражает скромный бюджет предварительного обучения токенов в 15 миллиардов долларов. PIQA (61,26%) показывает, что модель обладает базовыми физическими рассуждениями и извлекает выгоду из набора предварительной подготовки. TriviaQA (0,07%) подтверждает, что модель практически не имеет фактической достоверности – она не была подвергнута достаточно большому массиву знаний. MMLU (23,17%) является почти случайным для задачи с 4 вариантами, что указывает на очень ограниченные академические знания. Небольшой размер модели – 135 миллионов параметров на порядок меньше, чем у нынешних передовых моделей. Часто галлюцинирует: когда ему задают вопросы, выходящие за рамки простых приветствий или самоописания, он может придумывать правдоподобные, но неправильные ответы. Повторяющиеся циклы – иногда могут повторяться фразы или застревать в циклах, особенно при низкой температуре…

Модальности:
Генерация текста

Области применения:
Следование инструкциям Диалог / чат


Задача: Генерация текста
Автор: ThingAI
Теги: llama, chat, instruct, small-model, 135m, quark, conversational, en
Лайков: 7  |  Загрузок: 620

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.