Gemma 4 E4B

April 3, 2026Last synced Apr 7, 2026, 4:00 PM

Blended Price

Free/M

Input Price

Free/M

Output Price

Free/M

Speed

0 tok/s

TTFT

0.00s

Benchmark Scores

Intelligence Index

External Benchmarks

AA-Omniscience Accuracy

How Gemma 4 E4B Compares

Axes

X Axis

Y Axis

Bubble Size

Filters

Blended Price (USD)$0.00 – $30.0

AgMoBench Overall≥ 3.5

Providers

ai21-labsalibabaanthropicawsazurebaiducoheredeepseek

Show quadrants

anthropic

openai

google

meta

mistral

nvidia

kimi

xai

azure

deepseek

aws

cohere

baidu

ai21-labs

zai

reka-ai

xiaomi

alibaba

minimax

ibm

Bubble size = Context Window

16384.00

2000000.00

Compare with other models

GPQA Diamond

0.6 / 100

LiveCodeBench

— / 100

Terminal-Bench Hard

0.1 / 100

τ²-Bench

0.2 / 100

AA-Omniscience Hallucination RatePredicted

95.6 / 100

Aider PolyglotPredicted

40.5 / 100

AIMEPredicted

0.3 / 30

AIME 2025Predicted

0.4 / 30

AlpacaEval 2.0 LCPredicted

34.2 / 100

AlpacaEval 2.0 RawPredicted

26.7 / 100

ARC-AGI-1Predicted

11.1 / 100

ARC-AGI-1 Cost per TaskPredicted

0.0

ARC-AGI-2Predicted

0.1 / 100

ARC-AGI-2 Cost per TaskPredicted

0.1

BFCL (Berkeley Function Calling)Predicted

41.5

BigCodeBench CompletePredicted

53.6 / 100

BigCodeBench InstructPredicted

43.7 / 100

AA Intelligence Index (Matrix)Predicted

65.8

AA Long Context Reasoning (Matrix)Predicted

71.5

AIME 2024Predicted

79.7

AIME 2025 (Matrix)Predicted

77.5

Arena-Hard AutoPredicted

68.0

BrowseCompPredicted

62.2

BRUMO 2025Predicted

88.2

CMIMC 2025Predicted

75.8

GPQA Diamond (Matrix)Predicted

70.0

HLE (Matrix)Predicted

16.2

HMMT Feb 2025Predicted

59.8

HMMT Nov 2025Predicted

89.7

HumanEvalPredicted

85.4

IFBench (Matrix)Predicted

40.5

IFEvalPredicted

85.1

IMO 2025Predicted

15.8

LiveCodeBench (Matrix)Predicted

59.9

MATH-500 (Matrix)Predicted

95.2

MathArena Apex 2025Predicted

1.1

MMLU-Pro (Matrix)Predicted

78.1

MMMU-ProPredicted

80.7

MRCR v2Predicted

75.8

OSWorldPredicted

43.2

SimpleQAPredicted

28.0

SMT 2025Predicted

81.8

SWE-bench ProPredicted

38.2

Tau-Bench Telecom (Matrix)Predicted

96.1

Terminal-Bench 2.0Predicted

23.9

Terminal-Bench 1.0Predicted

18.8

USAMO 2025Predicted

8.7

Video-MMUPredicted

86.2

browsecompPredicted

59.5

BullshitBenchPredicted

17.1 / 100

Aider PolyglotPredicted

0.0

Apex AgentsPredicted

2.3

Arc Agi 2Predicted

0.0

BIG-Bench HardPredicted

3.0

CAD-EvalPredicted

5.0

Chess PuzzlesPredicted

0.1

CyBenchPredicted

0.2

DeepResearchBenchPredicted

0.3

FictionLiveBenchPredicted

0.4

GeoBenchPredicted

0.0

GSM8K (Epoch)Predicted

5.6

HellaSwagPredicted

2.0

Lech Mazur WritingPredicted

7.4

METR Time HorizonsPredicted

0.9

OTIS Mock AIME 2024–2025Predicted

0.2

PosttrainbenchPredicted

0.0

SimpleQA Verified (Epoch)Predicted

0.3

The Agent CompanyPredicted

1.7

TriviaQAPredicted

4.4

WinoGrandePredicted

0.8

FrontierMathPredicted

14.3 / 100

GAIA Level 1Predicted

49.5

GAIA Level 2Predicted

26.6

GAIA Level 3Predicted

2.4

GAIAPredicted

33.7 / 100

LegalBenchPredicted

83.5 / 100

LiveBench CodingPredicted

66.8 / 100

LiveBench Data AnalysisPredicted

44.8 / 100

LiveBench LanguagePredicted

55.1 / 100

LiveBench MathPredicted

63.3 / 100

LiveBench OverallPredicted

47.9 / 100

LiveBench ReasoningPredicted

43.1 / 100

LiveCodeBenchPredicted

0.4 / 100

LongBench v2 EasyPredicted

47.0

LongBench v2 HardPredicted

42.5

LongBench v2Predicted

38.5 / 100

MATH-500Predicted

0.9 / 100

MathVistaPredicted

62.4 / 100

MedQA (USMLE)Predicted

84.2

MLE-benchPredicted

23.9 / 100

MMLU ProPredicted

0.7 / 100

MMMUPredicted

70.8 / 100

MMTU Table UnderstandingPredicted

54.6 / 100

MT-BenchPredicted

7.9 / 10

NoLiMa (NIAH)Predicted

92.9 / 100

OCRBench v2Predicted

81.1 / 100

Open LLM AveragePredicted

32.4 / 100

Open LLM: BBHPredicted

60.6 / 100

Open LLM: GPQAPredicted

33.0 / 100

Open LLM: IFEvalPredicted

62.6 / 100

Open LLM: MATH Level 5Predicted

26.7 / 100

Open LLM: MMLU-PROPredicted

45.0 / 100

Open LLM: MUSRPredicted

43.3 / 100

RE-BenchPredicted

5.9

SimpleBenchPredicted

30.2 / 100

simpleqaPredicted

26.9

SWE-bench LitePredicted

23.2 / 100

SWE-bench VerifiedPredicted

47.4 / 100

tau-bench RetailPredicted

79.0 / 100

Vectara Factual ConsistencyPredicted

92.6 / 100

Vectara Hallucination RatePredicted

7.4 / 100

WebArenaPredicted

3.8 / 100

WeirdMLPredicted

32.3 / 100

WildBenchPredicted

48.8

IDP Coreidp-leaderboard

55.0 / 100

IDP OlmOCRidp-leaderboard

47.0 / 100

IDP OmniDocidp-leaderboard

59.7 / 100

IDP Overallidp-leaderboard

53.9 / 100