‌

Model library

Browse our library of open source models that are ready to deploy behind an API endpoint in seconds.

Deploy your own model

All LLM Transcription Text to speech Image generation Embedding Image processing Streaming

All

28 Qwen models

LLM

Qwen3.5 9B Latency

V1 - Latency - vLLM - H100

LLM

Qwen3.5 35B-A3B Latency

V1 - Latency - vLLM - H100

LLM

Qwen3.5 122B-A10B Latency

V1 - Latency - vLLM - H100

LLM

Qwen3 235B 2507

2507

Model API

LLM

Qwen3 Coder 480B

3 - Coder

LLM

Qwen 3 32B

V3 - TRT-LLM - H100

LLM

Qwen3 VL 235B

3 - Vision Language

LLM

Qwen3 Coder 30B

3 - Coder

LLM

Qwen 3 235B

V3 - SGLang - H100

LLM

Qwen 3 4B

V3 - TRT-LLM - H100

LLM

Qwen 2.5 14B Instruct

2.5 - TRT-LLM - H100

LLM

Qwen 2.5 32B Coder Instruct

2.5 - Coder - TRT-LLM - H100

LLM

Qwen 2.5 7B Math Instruct

2.5 - Math - TRT-LLM - H100 MIG 40GB

LLM

Qwen 2.5 32B QwQ

2.5 - QwQ - TRT-LLM - H100

LLM

Qwen3.5 4B Latency

V1 - Latency - vLLM - H100

Text to speech

Qwen3 TTS 12Hz Base Streaming 1.7B

TTS - 12Hz Base

Text to speech

Qwen3 TTS 12Hz Base Streaming 0.6B

TTS - 12Hz Base

Transcription

Qwen 3 ASR 1.7B

LLM

Qwen3 Omni Thinker

Omni - Thinker

LLM

Qwen3 Next 80B A3B Instruct

Qwen3 Next 80B A3B Instruct - Instruct - SGLang - H100

LLM

Qwen3 Next 80B A3B Thinking

Qwen3 Next 80B A3B Instruct - Instruct - SGLang - H100

LLM

Qwen 2.5 72B Instruct

2.5 - TRT-LLM - H100

LLM

Qwen 2.5 72B Math Instruct

2.5 - Math - TRT-LLM - H100

LLM

Qwen 2.5 14B Coder Instruct

2.5 - Coder - TRT-LLM - H100

LLM

Qwen 2.5 32B Instruct

2.5 - TRT-LLM - H100

LLM

Qwen 2.5 7B Coder Instruct

2.5 - Coder - TRT-LLM - H100 MIG 40GB

LLM

Qwen 2.5 7B Instruct

2.5 - TRT-LLM - H100 MIG 40GB

LLM

Qwen 2.5 3B Instruct

2.5 - TRT-LLM - A10G

🔥 Trending models

Model API

LLM

NVIDIA Nemotron 3 Super

Super

Model API

LLM

MiniMax M2.5

M2.5

Model API

LLM

GLM 5

Model API

LLM

Kimi K2.5

2.5

‌

Explore Baseten today

Start deploying Talk to an engineer