Метка: ONNXRuntime

Генерация текста

eldavoo/emma-5

Эта модель была перезагружена для архивирования. Я никоим образом не связан с Егомнией и ее парнем. Немодифицированный файл...

Генерация текста

microsoft/Phi-3-medium-4k-instruct-onnx-cpu

В этом репозитории размещены оптимизированные версии Phi-3-medium-4k-instruct для ускорения вывода с помощью среды выполнения ONNX для вашего процессора....

Генерация текста

LiquidAI/LFM2-24B-A2B-ONNX

LFM2-MoE — это модель «Смесь экспертов» с 24 миллиардами общих параметров и ~ 2 миллиардами активных параметров на...

Генерация текста

microsoft/Phi-3-vision-128k-instruct-onnx-directml

В этом репозитории размещены оптимизированные версии Phi-3-vision-128k-instruct для ускорения вывода с помощью DirectML и среды выполнения ONNX для...

Генерация текста

onnxruntime/DeepSeek-R1-Distill-ONNX

В этом репозитории размещены оптимизированные версии DeepSeek-R1-Distill-Qwen-1.5B и DeepSeek-R1-Distill-Qwen-7B для ускорения вывода с помощью ONNX Runtime. Здесь публикуются...

Генерация текста

LiquidAI/LFM2.5-350M-ONNX

В четвертом квартале используется GatherBlockQuantized для внедрения токенов и MatMulNBits для lm_head, повторно используя те же квантованные веса...

Генерация текста

microsoft/Phi-3-medium-4k-instruct-onnx-directml

В этом репозитории размещены оптимизированные версии Phi-3-medium-4k-instruct для ускорения вывода с помощью DirectML и среды выполнения ONNX для...

Генерация текста

microsoft/Phi-3-medium-4k-instruct-onnx-cuda

В этом репозитории размещены оптимизированные версии Phi-3-medium-4k-instruct для ускорения вывода с помощью среды выполнения ONNX для ваших машин...

Генерация текста

LiquidAI/LFM2.5-1.2B-Base-ONNX

Экспорт ONNX LFM2.5-1.2B-Base для кросс-платформенного вывода. LFM2.5 — это гибридная архитектура, сочетающая мультипликативные вентили и короткие свертки, оптимизированная...

Генерация текста

microsoft/Phi-3-medium-128k-instruct-onnx-cpu

В этом репозитории размещены оптимизированные версии Phi-3-medium-128k-instruct для ускорения вывода с помощью среды выполнения ONNX для вашего процессора....