dlite-v2-124m от AI Squared — это большая языковая модель, созданная на основе самой маленькой модели OpenAI GPT-2 и настроенная на одном графическом процессоре с корпусом из 15 тыс. записей (набор данных «Dolly 15k» от Databricks), чтобы помочь ей демонстрировать возможности чата. Как и модели Dolly V2 от Databricks, dlite-v2-124m (и все другие члены семейства dlite-v2) лицензируются как для исследовательского, так и для коммерческого использования. Мы чрезвычайно благодарны за работу, которую Databricks проделала по созданию набора данных databricks-dolly-15k, поскольку без него мы не смогли бы создать и выпустить эту модель под такой открытой и разрешительной лицензией. Хотя dlite-v2-124m не является современной моделью, мы считаем, что важно продемонстрировать уровень интерактивности, которого можно достичь на такой маленькой модели, обучаемой так дешево, поскольку она продолжает демонстрировать, что создание мощных возможностей ИИ может быть гораздо более доступным, чем считалось ранее. — Разработано: AI Squared, Inc. — Предоставлено: AI Squared, Inc. — Тип модели: Большая языковая модель — Язык(и) (NLP): EN — Лицензия: Apache v2.0 — Доработано на основе модели: GPT-2 dlite-v2-124m не является современной языковой моделью. dlite-v2-124m` — экспериментальный…
Модальности:
Генерация текста
Задача: Генерация текста
Автор: aisquared
Теги: gpt2, en, text-generation-inference, endpoints_compatible
Лайков: 7 | Загрузок: 592
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.