Каноническая база IUPAC2SMILES была разработана для точного перевода химических названий IUPAC в SMILES. Каноническая база IUPAC2SMILES основана на модели MT5 с оптимизацией реализации различных токенизаторов для кодера и декодера. — Разработано: Knowladgator Engineering — Тип модели: Кодер-декодер с механизмом внимания — Язык(и) (NLP): SMILES, IUPAC (английский) — Лицензия: Apache License 2.0 Эта модель имеет ограниченную точность при обработке больших молекул и в настоящее время не поддерживает изомерные и изотопные SMILES. Модель была обучена на 100 миллионах примеров пар SMILES-IUPAC с lr=0,00001, Batch_size=512 для 2 эпох. *Согласно оригинальной статье https://jcheminf.biomedcentral.com/articles/10.1186/s13321-021-00512-4.
Модальности:
Генерация текста
Области применения:
Медицина Биология Химия
Задача: Генерация текста
Автор: knowledgator
Теги: mt5, text2text-generation, chemistry, biology, medical, smiles, iupac, text-generation-inference
Лайков: 6 | Загрузок: 124
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.