Leaderboard

On-device LLM performance rankings powered by Glicko-2

Pixel 8

Android

Rank

#138

Rating

1,492

±14 RD

Win Rate

49.3%

Conservative Rating

1,464

TG Rating

1,483

PP Rating

1,549

Matches

1,344

Record

662W – 682L

Models Tested

Model	TG Median (tok/s)	PP Median (tok/s)	TG Best	PP Best	Runs
Thinker-SmolLM2-135M-Instruct-Reasoning.i1-Q4_K_M	28.34	211.70	28.34	211.70	1
gemma-3-1b-it-q4_0_s	24.85	141.23	24.85	141.23	1
LFM2.5-1.2B-Instruct-Q4_K_M	22.27	91.43	22.27	91.43	1
SmolLM2-360M-Instruct.i1-IQ4_XS	19.95	116.81	19.95	116.81	1
smollm2-360m-instruct-q8_0	19.05	116.45	19.66	133.61	2
LFM2.5-1.2B-Thinking-Q4_K_M	14.43	62.66	14.43	62.66	1
gemma-3-270m-it-IQ4_NL	12.36	249.50	12.36	249.50	1
Dolphin3.0-Llama3.2-1B-Q4_K_M	10.60	32.61	10.60	32.61	1
SmolLM2-1.7B-Instruct-abliterated.i1-Q4_K_M	10.40	28.92	10.40	28.92	1
Dolphin3.0-Llama3.2-1B-Q8_0	10.10	41.01	10.10	41.01	1
gemma-3-1b-it.Q8_0	10.02	93.96	10.02	93.96	1
smollm2-1.7b-instruct-q4_k_m	8.72	20.43	8.72	20.43	1
gemma-3-1b-it.Q5_K_M	8.66	41.29	8.66	41.29	1
SmolLM2-1.7B-Instruct-abliterated.i1-IQ4_XS	8.64	19.70	8.64	19.70	1
qwen2.5-1.5b-instruct-q8_0	8.49	45.86	9.59	54.06	3
DeepSeek-R1-Distill-Qwen-1.5B-Abliterated-dpo.i1-IQ4_XS	8.34	26.65	8.34	26.65	1
DeepSeek-R1-Distill-Qwen-1.5B-Abliterated-dpo.Q4_K_M	7.75	24.30	7.75	24.30	1
Qwen_Qwen3-0.6B-IQ4_XS	7.48	66.64	7.48	66.64	1
DeepSeek-R1-Distill-Qwen-1.5B-uncensored.Q8_0	6.99	54.54	6.99	54.54	1
DeepSeek-R1-Distill-Qwen-1.5B-Abliterated-dpo.Q8_0	6.92	32.65	6.92	32.65	1
llama-3.2-1b-instruct-q8_0	6.65	64.15	12.85	78.82	9
SmolLM2-1.7B-Instruct-Q8_0	6.03	22.95	6.03	22.95	1
qwen2.5-3b-instruct-q5_k_m	5.59	16.32	6.00	16.54	3
Hermes-3-Llama-3.2-3B-abliterated.i1-Q4_K_M	5.48	12.50	5.48	12.50	1
SmallThinker-3B-Preview-abliterated.i1-IQ4_XS	5.45	12.20	5.45	12.20	1
Phi-3.5-mini-instruct.Q4_K_M	5.05	12.21	6.04	13.74	3
gemma-2-2b-it-abliterated-Q4_K_M	4.89	14.72	4.89	14.72	1
Llama-3.2-3B-Instruct-Q6_K	4.74	13.12	5.37	15.16	6
gemma-2-2b-it-Q6_K	3.79	17.51	5.06	22.10	5
Gemmasutra-Mini-2B-v1-Q6_K	3.08	11.74	4.73	13.21	2
gemma-3-4b-it.Q5_K_M	2.31	10.27	2.31	10.27	1

Head-to-Head Record

Opponent	Shared Models	W	L	D	Win Rate
Galaxy S25 Ultra vs	10	0	10	0	0%
X200 Pro vs	10	0	10	0	0%
iPhone 15 Pro vs	9	0	9	0	0%
iPhone 16 Pro Max vs	9	0	9	0	0%
Pixel 8 Pro vs	9	5	4	0	56%
Galaxy A55 5G vs	9	7	1	1	78%
iPhone 15 Pro Max vs	9	0	9	0	0%
Galaxy S24 Ultra vs	9	0	9	0	0%
iPhone 13 Pro Max vs	9	0	9	0	0%
Galaxy S24 vs	9	0	9	0	0%
Nothing Phone (1)vs	8	5	3	0	63%
Pixel 9 Pro XL vs	8	6	2	0	75%
Pixel 9 Pro vs	8	5	3	0	63%
Galaxy S23 vs	8	0	8	0	0%
OnePlus 13 vs	8	0	8	0	0%
iPhone 16 vs	8	0	8	0	0%
Galaxy S23 Ultra vs	8	0	8	0	0%
REDMAGIC 9 Pro vs	8	2	6	0	25%
iPhone 15 Plus vs	8	0	8	0	0%
iPhone 17 vs	8	0	8	0	0%
iPhone 16 Pro vs	8	0	8	0	0%
Pixel 6 vs	8	5	3	0	63%
Galaxy S22 Ultra vs	8	1	7	0	13%
Xiaomi 11T Pro vs	8	1	6	1	13%
Pixel 7 Pro vs	8	7	1	0	88%
iPhone 13 Pro vs	8	1	7	0	13%
Pixel 7 vs	8	6	2	0	75%
Galaxy S20 FE vs	7	3	4	0	43%
Galaxy Z Fold7 vs	7	0	7	0	0%
iPhone 12 Pro vs	7	1	6	0	14%
moto g54 5G vs	7	7	0	0	100%
Galaxy S24+vs	7	1	6	0	14%
Galaxy S22 vs	7	3	4	0	43%
Galaxy S25 vs	7	0	7	0	0%
POCO X6 Pro 5G vs	7	0	7	0	0%
POCO F6 vs	7	1	6	0	14%
iPad Pro 11 inch 5th Gen vs	7	0	7	0	0%
Galaxy S23 FE vs	7	5	2	0	71%
POCO Pad vs	7	7	0	0	100%
Galaxy Z Fold6 vs	6	1	5	0	17%
Xiaomi 15 vs	6	0	6	0	0%
Xiaomi 14T Pro vs	6	0	6	0	0%
Xiaomi Pad 6 vs	6	5	1	0	83%
POCO X7 Pro vs	6	0	6	0	0%
OnePlus Nord 4 vs	6	1	5	0	17%
Galaxy S25+vs	6	0	6	0	0%
OnePlus 11 5G vs	6	1	5	0	17%
OnePlus 15 vs	6	0	6	0	0%
Galaxy A54 5G vs	6	6	0	0	100%
POCO F5 vs	6	0	6	0	0%

1–50 of 322 rows

1 / 7

Performance by App Version

Model

ImprovedRegressed

Compare With

#1iPad Pro 11 inch 6th Gen #2iPad Pro 12.9 inch 7th Gen #3iPad Pro 11 inch 5th Gen #4iPad Pro 11 inch 4th Gen #5iPhone 17 Pro #6iPhone 17 Pro Max #7iPad Air 11 inch 6th Gen #8iPad Air 13 inch 6th Gen #137OnePlus 9 Pro 5G #139iPhone 12 Mini