Edit Models filters

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

arxiv: 2506.05176

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Mixture of Experts

Carbon Emissions

Models

55

Full-text search

Active filters: 2506.05176

Qwen/Qwen3-Embedding-8B

Feature Extraction • 8B • Updated Jul 7 • 848k • • 476

Qwen/Qwen3-Embedding-0.6B

Feature Extraction • 0.6B • Updated Jun 20 • 4.29M • • 769

Qwen/Qwen3-Reranker-0.6B

Text Ranking • 0.6B • Updated Jun 9 • 539k • 273

Qwen/Qwen3-Embedding-0.6B-GGUF

0.6B • Updated Jul 14 • 21.7k • 470

Qwen/Qwen3-Reranker-4B

Text Ranking • 4B • Updated Jun 9 • 59.2k • 107

Qwen/Qwen3-Embedding-8B-GGUF

8B • Updated Jul 15 • 8.83k • 93

Qwen/Qwen3-Reranker-8B

Text Ranking • 8B • Updated Jun 9 • 45.2k • 196

tomaarsen/Qwen3-Reranker-4B-seq-cls

Text Ranking • 4B • Updated Jun 16 • 5.06k • 9

Qwen/Qwen3-Embedding-4B

Feature Extraction • 4B • Updated Jun 20 • 428k • 176

Qwen/Qwen3-Embedding-4B-GGUF

4B • Updated Aug 3 • 50.1k • 74

woodx/Qwen3-Embedding-0.6B-SGLang

Feature Extraction • Updated Jun 7 • 50

zhlo/Qwen3-Embedding-0.6B-deploy

Feature Extraction • 0.6B • Updated Jun 8 • 9

dulimov/Qwen3-Reranker-0.6B-rk3588-1.2.1

Text Ranking • Updated Jun 9 • 13

dulimov/Qwen3-Embedding-0.6B-rk3588-1.2.1

Feature Extraction • Updated Jun 9 • 15 • 1

Mungert/Qwen3-Embedding-0.6B-GGUF

Feature Extraction • 0.6B • Updated Sep 24 • 994 • 4

Mungert/Qwen3-Embedding-8B-GGUF

Feature Extraction • 8B • Updated Sep 24 • 560 • 3

ushakov15/MNLP_M3_document_encoder

Feature Extraction • 0.6B • Updated Jun 10 • 9

QuantFactory/Qwen3-Reranker-0.6B-GGUF

Text Ranking • 0.8B • Updated Jun 11 • 269 • 3

QuantFactory/Qwen3-Reranker-8B-GGUF

Text Ranking • 8B • Updated Jun 11 • 1.5k • 3

QuantFactory/Qwen3-Reranker-4B-GGUF

Text Ranking • 4B • Updated Jun 11 • 400 • 3

tomaarsen/Qwen3-Reranker-8B-seq-cls

Text Ranking • 8B • Updated Jun 16 • 1.87k • 5

dengcao/Qwen3-Reranker-0.6B

Text Ranking • Updated Jul 8

dengcao/Qwen3-Reranker-4B

Text Ranking • Updated Jul 8

dengcao/Qwen3-Reranker-8B

Text Ranking • Updated Jul 8 • 3

dengcao/Qwen3-Embedding-0.6B-GGUF

Feature Extraction • 0.6B • Updated Jun 21 • 71 • 1

yourleige/test_model_upload

Text Classification • 0.6B • Updated Jul 2 • 11

DefaultDF/Qwen3-Embedding-0.6B-GGUF

Updated Jun 26 • 85

MrDragonFox/Qwen3

0.6B • Updated Jun 27 • 29

dengcao/Qwen3-Reranker-4B-seq-cls

Text Ranking • 4B • Updated Jun 28 • 6

dengcao/Qwen3-Embedding-8B

Feature Extraction • Updated Jul 8