emma-5
Эта модель была перезагружена для архивирования. Я никоим образом не связан с Егомнией и ее парнем. Немодифицированный файл...
Эта модель была перезагружена для архивирования. Я никоим образом не связан с Егомнией и ее парнем. Немодифицированный файл...
В этом репозитории размещены оптимизированные версии Phi-3-medium-4k-instruct для ускорения вывода с помощью среды выполнения ONNX для вашего процессора....
LFM2-MoE — это модель «Смесь экспертов» с 24 миллиардами общих параметров и ~ 2 миллиардами активных параметров на...
В этом репозитории размещены оптимизированные версии Phi-3-vision-128k-instruct для ускорения вывода с помощью DirectML и среды выполнения ONNX для...
В этом репозитории размещены оптимизированные версии DeepSeek-R1-Distill-Qwen-1.5B и DeepSeek-R1-Distill-Qwen-7B для ускорения вывода с помощью ONNX Runtime. Здесь публикуются...
В четвертом квартале используется GatherBlockQuantized для внедрения токенов и MatMulNBits для lm_head, повторно используя те же квантованные веса...
В этом репозитории размещены оптимизированные версии Phi-3-medium-4k-instruct для ускорения вывода с помощью DirectML и среды выполнения ONNX для...
В этом репозитории размещены оптимизированные версии Phi-3-medium-4k-instruct для ускорения вывода с помощью среды выполнения ONNX для ваших машин...
Экспорт ONNX LFM2.5-1.2B-Base для кросс-платформенного вывода. LFM2.5 — это гибридная архитектура, сочетающая мультипликативные вентили и короткие свертки, оптимизированная...
В этом репозитории размещены оптимизированные версии Phi-3-medium-128k-instruct для ускорения вывода с помощью среды выполнения ONNX для вашего процессора....