Benchmarks

Leaderboard

All active models ranked by P50 latency — the median response time for a standard 500-token output, measured from EU (Amsterdam). Green < 500 ms, yellow 500–1000 ms, red > 1000 ms.

Filter:

#
1	FLUX.1 Kontext [pro] — Multi-Image FusionB	fal.ai	B	0	0	—	2026-07-31
2	FLUX.1 Kontext [max] — Multi-Image FusionA	fal.ai	A	0	0	—	2026-07-31
3	NVIDIA Nemotron Super 49B v1.5A	OpenRouter	A	32	32	—	2026-07-31
4	Qwen3-Coder-30B-A3B-InstructB	OVH AI Endpoints (GRA)	B	89	102	100	2026-07-31
5	SDXL 1.0C	Hugging Face (nscale)	C	101	103	—	2026-07-31
6	Mistral-Nemo-Instruct-2407C	OVH AI Endpoints (GRA)	C	108	121	26	2026-07-31
7	Mistral-Small-3.2-24B-Instruct-2506B	OVH AI Endpoints (GRA)	B	129	182	100	2026-07-31
8	Meta-Llama-3_3-70B-InstructB	OVH AI Endpoints (GRA)	B	135	181	100	2026-07-31
9	Qwen2.5-VL-72B-InstructB	OVH AI Endpoints (GRA)	B	149	175	100	2026-07-31
10	Mistral-7B-Instruct-v0.3C	OVH AI Endpoints (GRA)	C	173	512	100	2026-07-31
11	Llama 4 ScoutA	OpenRouter	A	191	268	—	2026-07-31
12	Nous Hermes 3 70BA	OpenRouter	A	200	353	—	2026-07-31
13	Mistral Voxtral Small 24BA	OpenRouter	A	210	268	—	2026-07-31
14	gpt-oss-20bC	OVH AI Endpoints (GRA)	C	236	294	100	2026-07-31
15	MiniMax M2.5A	OpenRouter	A	284	296	—	2026-07-31
16	Qwen 2.5 VL 72B InstructA	OpenRouter	A	285	299	—	2026-07-31
17	gpt-oss-120bC	OVH AI Endpoints (GRA)	C	294	627	100	2026-07-31
18	FLUX.1 SchnellB	Hugging Face (nscale)	B	403	599	—	2026-07-31
19	Gemini 2.5 FlashA	Google Gemini	A	418	994	100	2026-07-31
20	Gemini 2.5 Flash-LiteB	Google Gemini	B	428	428	100	2026-07-31
21	gpt-4.1-nanoC	OpenAI	C	435	480	100	2026-07-31
22	gpt-5.4-miniA	OpenAI	A	483	500	100	2026-07-31
23	Qwen3.5-9BB	OVH AI Endpoints (GRA)	B	491	539	100	2026-07-31
24	gpt-4.1B	OpenAI	B	493	772	100	2026-07-31
25	gpt-4o-miniC	OpenAI	C	502	561	100	2026-07-31
26	Qwen3-32BB	OVH AI Endpoints (GRA)	B	509	622	95	2026-07-31
27	Qwen3.5-397B-A17BA	OVH AI Endpoints (GRA)	A	516	532	100	2026-07-31
28	DeepSeek v4 ProA	OpenRouter	A	552	1153	—	2026-07-31
29	o3-miniC	OpenAI	C	553	594	100	2026-07-31
30	Llama 3.3 70B InstructA	OpenRouter	A	559	587	—	2026-07-31
31	gpt-4.1-miniC	OpenAI	C	561	809	95	2026-07-31
32	o4-miniC	OpenAI	C	563	750	100	2026-07-31
33	gpt-4oC	OpenAI	C	618	795	100	2026-07-31
34	o3C	OpenAI	C	618	626	100	2026-07-31
35	gpt-5.4A	OpenAI	A	627	754	100	2026-07-31
36	gpt-5.4-nanoC	OpenAI	C	656	673	100	2026-07-31
37	Qwen 3.6 PlusA	OpenRouter	A	690	719	—	2026-07-31
38	Qwen 3.7 MaxA	OpenRouter	A	708	736	—	2026-07-31
39	gpt-4.1-nano-2025-04-14C	OpenAI	C	721	—	100	2026-07-26
40	gpt-5.1B	OpenAI	B	735	753	100	2026-07-31
41	gpt-5.2-chat-latestC	OpenAI	C	750	766	100	2026-07-31
42	gpt-5C	OpenAI	C	760	1049	100	2026-07-31
43	Gemini 3.1 Flash LiteB	Google Gemini	B	812	—	100	2026-07-26
44	gpt-5.3-chat-latestC	OpenAI	C	813	840	100	2026-07-31
45	gpt-5.2B	OpenAI	B	822	1505	100	2026-07-31
46	gpt-5-miniC	OpenAI	C	832	920	100	2026-07-31
47	Cohere Command-AA	OpenRouter	A	845	1853	—	2026-07-31
48	Llama 4 MaverickA	OpenRouter	A	899	4866	—	2026-07-31
49	DeepSeek v3.2A	OpenRouter	A	922	1702	—	2026-07-31
50	Claude Haiku 4.5A	Anthropic	A	938	1027	100	2026-07-31
51	gpt-5-nanoC	OpenAI	C	987	988	98	2026-07-31
52	gpt-4o-2024-11-20C	OpenAI	C	1003	—	100	2026-07-26
53	Gemini Flash-Lite LatestC	Google Gemini	C	1008	—	100	2026-07-26
54	gpt-5.4-mini-2026-03-17A	OpenAI	A	1046	—	100	2026-07-26
55	gpt-5.5C	OpenAI	C	1050	1051	100	2026-07-31
56	gpt-3.5-turboC	OpenAI	C	1078	—	100	2026-07-26
57	Claude Opus 4.8A	Anthropic	A	1094	1436	100	2026-07-31
58	gpt-4o-mini-2024-07-18C	OpenAI	C	1097	—	100	2026-07-26
59	Gemini 2.5 ProA	Google Gemini	A	1195	1263	0	2026-07-31
60	gpt-4o-2024-08-06C	OpenAI	C	1232	—	100	2026-07-26
61	gpt-3.5-turbo-1106C	OpenAI	C	1249	—	100	2026-07-26
62	gpt-4o-mini-search-previewC	OpenAI	C	1276	—	70	2026-07-26
63	gpt-5.1-2025-11-13B	OpenAI	B	1317	—	100	2026-07-26
64	Claude Opus 5A	Anthropic	A	1319	1411	100	2026-07-31
65	Claude Sonnet 4.6A	Anthropic	A	1331	5762	100	2026-07-31
66	gpt-5.4-2026-03-05B	OpenAI	B	1375	—	100	2026-07-26
67	Qwen3.7 PlusB	Alibaba Cloud Qwen (DashScope Intl)	B	1406	1416	—	2026-07-31
68	o3-2025-04-16B	OpenAI	B	1425	—	100	2026-07-26
69	gpt-4.1-2025-04-14C	OpenAI	C	1445	—	100	2026-07-26
70	gpt-5.4-nano-2026-03-17A	OpenAI	A	1461	—	100	2026-07-26
71	Claude Opus 4.7B	Anthropic	B	1466	1777	100	2026-07-31
72	gpt-3.5-turbo-0125C	OpenAI	C	1486	—	100	2026-07-26
73	gpt-5.2-2025-12-11B	OpenAI	B	1507	—	100	2026-07-26
74	gpt-4-0613C	OpenAI	C	1524	—	100	2026-07-26
75	Claude Sonnet 4.5B	Anthropic	B	1547	1700	100	2026-07-31
76	gpt-5-search-api-2025-10-14B	OpenAI	B	1551	—	100	2026-07-26
77	GLM-4.5V (vision)A	Z.ai (GLM / Zhipu)	A	1580	5254	22	2026-07-31
78	Claude Opus 4.1C	Anthropic	C	1682	2750	100	2026-07-31
79	gpt-4o-2024-05-13C	OpenAI	C	1695	—	100	2026-07-26
80	gpt-3.5-turbo-16kC	OpenAI	C	1697	—	100	2026-07-26
81	gpt-5.5-2026-04-23A	OpenAI	A	1728	—	100	2026-07-26
82	o3-mini-2025-01-31C	OpenAI	C	1738	—	100	2026-07-26
83	Claude Opus 4.6B	Anthropic	B	1739	4563	100	2026-07-31
84	GLM-4.6V (vision)A	Z.ai (GLM / Zhipu)	A	1863	3643	0	2026-07-31
85	GLM-5A	Z.ai (GLM / Zhipu)	A	1952	2935	93	2026-07-31
86	gpt-4o-search-previewC	OpenAI	C	2032	—	100	2026-07-26
87	o4-mini-2025-04-16B	OpenAI	B	2161	—	100	2026-07-26
88	gpt-4.1-mini-2025-04-14C	OpenAI	C	2219	—	100	2026-07-26
89	GLM-5 TurboB	Z.ai (GLM / Zhipu)	B	2239	3292	0	2026-07-31
90	gpt-5-mini-2025-08-07B	OpenAI	B	2427	—	100	2026-07-26
91	o1C	OpenAI	C	2530	—	100	2026-07-26
92	Qwen3.7 MaxA	Alibaba Cloud Qwen (DashScope Intl)	A	2657	2729	—	2026-07-31
93	Nano BananaB	Google Gemini	B	2873	—	97	2026-06-21
94	o1-2024-12-17C	OpenAI	C	2940	—	100	2026-07-26
95	Gemini 3 Flash PreviewC	Google Gemini	C	2946	—	100	2026-07-26
96	gpt-5-nano-2025-08-07B	OpenAI	B	2962	—	100	2026-07-26
97	Gemini 3.5 FlashA	Google Gemini	A	2990	—	100	2026-07-26
98	gpt-4C	OpenAI	C	3002	—	100	2026-07-26
99	GLM-5.1A	Z.ai (GLM / Zhipu)	A	3299	3299	80	2026-07-31
100	Gemini Flash LatestB	Google Gemini	B	3571	—	100	2026-07-26
101	gpt-5-search-apiC	OpenAI	C	3713	—	100	2026-07-26
102	Claude Fable 5A	Anthropic	A	4094	4131	100	2026-07-31
103	Gemini Robotics-ER 1.6 PreviewB	Google Gemini	B	4190	—	5	2026-06-21
104	Nano Banana 2B	Google Gemini	B	4330	—	91	2026-06-21
105	Gemini Pro LatestC	Google Gemini	C	4359	—	100	2026-07-26
106	GLM-5.2A	Z.ai (GLM / Zhipu)	A	4708	5272	75	2026-07-31
107	gpt-5-2025-08-07B	OpenAI	B	4774	—	100	2026-07-26
108	gpt-4-turboC	OpenAI	C	4835	—	100	2026-07-26
109	Gemini 3.1 Pro PreviewC	Google Gemini	C	4955	—	86	2026-07-26
110	GLM-4.5 AirB	Z.ai (GLM / Zhipu)	B	5458	5701	62	2026-07-31
111	GLM-4.7A	Z.ai (GLM / Zhipu)	A	5931	10997	95	2026-07-31
112	gpt-4-turbo-2024-04-09C	OpenAI	C	6778	—	100	2026-07-26
113	Gemini 3.1 Pro Preview Custom ToolsC	Google Gemini	C	7298	—	0	2026-06-21
114	CogView-4B	Z.ai (GLM / Zhipu)	B	8088	8632	0	2026-07-31
115	Claude Opus 4.5B	Anthropic	B	8737	9217	100	2026-07-31
116	Nano Banana ProA	Google Gemini	A	11201	—	0	2026-06-21
117	GLM-4.5A	Z.ai (GLM / Zhipu)	A	11576	18162	95	2026-07-31
118	GLM-4.6A	Z.ai (GLM / Zhipu)	A	12254	16146	2	2026-07-31
119	GLM ImageB	Z.ai (GLM / Zhipu)	B	30000	30000	—	2026-07-31

119 of 119 models · click column headers to sort

Fast (< 500 ms)

Medium (500–1000 ms)

Slow (> 1000 ms)

Updated every 6 hours · P50 = median latency · P95 = tail latency