LongSafari/hyenadna-large-1m-seqlen-hf - Каталог нейросетей
Генерация текста

LongSafari/hyenadna-large-1m-seqlen-hf

Добавлено:
LongSafari/hyenadna-large-1m-seqlen-hf

Добро пожаловать! HyenaDNA — это базовая модель генома дальнего действия, предварительно обученная на контекстах длиной до 1 миллиона токенов с разрешением в один нуклеотид. Ниже представлен обзор модели и обучения. А еще лучше посетите эти ресурсы. Мы загрузили коллекцию всех предварительно обученных контрольных точек HyenaDNA. Вы увидите модели разных размеров и длины последовательности. В организации LongSafari также существуют оригинальные версии каждой модели, предназначенные только для веса, которые предназначены для загрузки из исходного репозитория GitHub. Эти модели имеют идентичные выходные данные моделям из коллекции выше, но имеют другой интерфейс. В этом кратком примере кода мы демонстрируем тонкую настройку HyenaDNA для задачи классификации последовательностей. В этом образце используется средняя контрольная точка с максимальной длиной последовательности 160 тыс. нуклеотидов. Обратите внимание, что обучение завершится неудачей, если вы используете длину последовательности, превышающую максимальную поддерживаемую длину для выбранной вами контрольной точки. В ходе тестирования нам удалось обучить последовательность длиной примерно до 250 тыс. нуклеотидов на графическом процессоре Colab T4 (16 ГБ видеопамяти). Для более длинных последовательностей потребуется больше памяти. Эти блокноты также могут оказаться вам полезными. Хотя они не являются специфичными для…

Модальности:
Генерация текста

Области применения:
Биология


Задача: Генерация текста
Автор: LongSafari
Теги: hyenadna, dna, biology, genomics, hyena, custom_code
Лайков: 25  |  Загрузок: 2,456

Открыть на HuggingFace →

Описание основано на материалах HuggingFace. Перевод выполнен автоматически.