В последние годы модели большого языка (LLM) продемонстрировали замечательную универсальность, предлагая потенциальные приложения в специализированных областях, таких как здравоохранение и медицина. Несмотря на наличие различных программ LLM с открытым исходным кодом, адаптированных для здравоохранения, адаптация LLM общего назначения к медицинской сфере представляет собой серьезные проблемы. В этой статье мы представляем BioMistral, LLM с открытым исходным кодом, адаптированный для биомедицинской области, использующий Mistral в качестве базовой модели и дополнительно прошедший предварительное обучение на PubMed Central. Мы проводим комплексную оценку BioMistral по эталону, включающему 10 установленных медицинских задач на вопросы и ответы (QA) на английском языке. Мы также исследуем облегченные модели, полученные с помощью подходов квантования и слияния моделей. Наши результаты демонстрируют превосходные характеристики BioMistral по сравнению с существующими медицинскими моделями с открытым исходным кодом и его конкурентное преимущество по сравнению с запатентованными аналогами. Наконец, чтобы решить проблему ограниченной доступности данных за пределами английского языка и оценить многоязычное обобщение медицинских программ LLM, мы автоматически перевели и оценили этот тест на 7 других языков. Это знаменует собой первую крупномасштабную многоязычную оценку…
Модальности:
Генерация текста
Области применения:
Диалог / чат Медицина Биология
Задача: Генерация текста
Автор: BioMistral
Теги: tensorboard, mistral, medical, biology, conversational, fr, en, de
Лайков: 493 | Загрузок: 54,528
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.