Mistral-7B-Instruct-v0.2-DARE
Эта модель использует метод DARE для объединения Mistral-7B-Instruct-v0.2 с 3 ведущими моделями по состоянию на 12 декабря в...
Эта модель использует метод DARE для объединения Mistral-7B-Instruct-v0.2 с 3 ведущими моделями по состоянию на 12 декабря в...
Воспроизведение OpenLLaMA с использованием 128 графических процессоров H100 в Bfloat16. Предварительные данные состоят из Falcon, Starcoder и Wikipedia,...
Это модель Digital Socrates 7B (DS-7B), описанная в нашей статье: Digital Socrates: Evaluating LLM через критику объяснений (ссылка...
Добро пожаловать на первый выпуск тамильской модели обучения LLaMA 13B – важный шаг в развитии LLM для тамильского...
Чат и поддержка: сервер Discord TheBloke Хотите внести свой вклад? Страница TheBloke на Patreon Работа TheBloke в области...
Чат и поддержка: сервер Discord TheBloke Хотите внести свой вклад? Страница TheBloke на Patreon Работа TheBloke в области...
Чат и поддержка: сервер Discord TheBloke Хотите внести свой вклад? Страница TheBloke на Patreon Работа TheBloke в области...
> Выпуск 2023.10.06 uukuguy/speechless-codellama-34b-v2.0. humaneval-python pass@1: 75.61 Выполните точную настройку Phind/Phind-CodeLlama-34B с помощью наборов данных Dolphin (1% GPT4),...
Это OmegLLaMA LoRA Ксандера Бойса, объединенная с OpenLLama 3B. Если интересы несколько, разделите их пространством. Повторяйте «Вы» и...
1. Краткое описание модели 2. Использование 3. Ограничения 4. Обучение 5. Лицензия 6. Цитирование Это Megatron-версия StarCoder. Мы...