Модель Narrow Transformer (NT) NT-Java-1.1B — это модель специализированного кода с открытым исходным кодом, созданная путем расширения предварительного обучения на StarCoderBase-1B и предназначенная для задач кодирования в области программирования на Java. Модель представляет собой преобразователь, предназначенный только для декодера, с вниманием к нескольким запросам и длиной контекста 8192 токена. Модель была обучена с использованием Java-подмножества набора данных StarCoderData, который составляет около 22 миллиардов токенов. — Репозиторий: Infosys/Megatron-LM — Документ: Narrow Transformer: Java-LM на базе Starcoder для настольных компьютеров — Язык(и): Java Для моделей большого кода требуется специальное оборудование, такое как графические процессоры, для вывода, что подчеркивает необходимость исследований по созданию небольших моделей кода, которые можно будет развернуть на настольных компьютерах разработчиков. Будучи малой языковой моделью (SLM), NT-Java-1.1B может быть развернута на ПК потребительского уровня. Он превосходит модели с открытым исходным кодом сопоставимого размера в задачах программирования на Java. Не стесняйтесь исследовать эту мощную языковую модель для своих Java-проектов! Квантованные версии NT-Java-1.1B, NT-Java-1.1B-GGUF сравнимы по производительности с открытием моделей 1B в тестах кода Java MultiPL-E и могут использоваться с несколькими платформами, включая Ollama, GPT4ALL и т. д., что делает их универсальными для различных сценариев развертывания. …
Модальности:
Генерация текста
Области применения:
Генерация кода
Языки программирования:
Java
Задача: Генерация текста
Автор: InfosysEnterprise
Теги: gpt_bigcode, NarrowTransformer, code, model-index, text-generation-inference, endpoints_compatible
Лайков: 10 | Загрузок: 1,028
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.