Поиграйте с настроенным по инструкциям StarCoderPlus на StarChat-Beta. 1. Краткое описание модели 2. Использование 3. Ограничения 4. Обучение 5. Лицензия 6. Цитирование StarCoderPlus — это доработанная версия StarCoderBase на токенах 600B из английского веб-набора данных RedefineWeb в сочетании со StarCoderData из The Stack (v1.2) и набором данных Википедии. Это языковая модель с 15,5 миллиардами параметров, обученная на английском и более чем 80 языках программирования. Модель использует внимание к множественным запросам, контекстное окно из 8192 токенов и была обучена с использованием цели «Заполнить посередине» на 1,6 триллионах токенов. — Репозиторий: bigcode/Megatron-LM — Веб-сайт проекта: bigcode-project.org — Контактное лицо: contact@bigcode-project.org — Языки: английский и более 80 языков программирования Модель была обучена на английском языке и коде GitHub. По существу, это не модель инструкций и не команды типа «Напишите функцию, вычисляющую квадратный корень». не работают хорошо. Тем не менее, настроенная на инструкции версия StarChat может стать хорошим помощником. При заполнении середины используются специальные токены для идентификации части префикса/середины/суффикса входных и выходных данных: набор данных обучающего кода модели был отфильтрован только для разрешительных лицензий. Тем не менее, модель…
Модальности:
Генерация текста
Области применения:
Генерация кода
Задача: Генерация текста
Автор: bigcode
Теги: code, endpoints_compatible
Лайков: 6 | Загрузок: 0
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.