Foresight V1 32B — это модель прогнозирования, доработанная на основе Qwen3-32B с помощью RL на основе результатов. Несмотря на то, что он в 10–100 раз меньше, он превосходит передовые модели по шкале Брайера, ECE и рентабельности. Нашу последнюю модель Foresight V3 можно протестировать на сайте Dashboard.lightningrod.ai. Lightning Rod Labs позволяет перейти от необработанных данных к точно настроенной модели. Благодаря автоматизированному генерированию, точной настройке и оценке данных обучения — все в одном месте. Маркировка вручную не требуется. Февраль 2026 г.: Foresight V1 32B занял первое место в рейтинге Prophet Arena Sports, тесте, проводимом лабораторией SIGMA в Университете Чикаго, опередив Grok-4, GPT-5.2, Gemini 3 Pro и Claude Opus 4.5 по вопросам прогнозирования в реальном времени. Январь 2026 г.: Foresight V1 32B — единственная неграничная модель, входящая в пятерку лучших в ForecastBench, независимом эталоне прогнозирования, проводимом Научно-исследовательским институтом прогнозирования, где ИИ конкурируют в решении реальных вопросов прогнозирования. По результатам оценки 25 августа 2025 г. по 251 живому вопросу Polymarket, Foresight-v1 превзошел все протестированные модели Frontier по точности (по шкале Брайера), калибровке (ECE) и прибыльности. Более подробную информацию о нашей методологии и результатах можно найти здесь. Foresight V1 32B был обучен с использованием RL, основанного на результатах. Модель была представлена…
Модальности:
Генерация текста
Области применения:
Диалог / чат
Задача: Генерация текста
Автор: LightningRodLabs
Теги: qwen3, forecasting, prediction, reinforcement-learning, calibration, polymarket, conversational
Лайков: 9 | Загрузок: 62
Описание основано на материалах HuggingFace. Перевод выполнен автоматически.