Mistral Large 2411

Last synced Apr 7, 2026, 2:04 PM131K context

Blended Price

$3.00/M

Input Price

$2.00/M

Output Price

$6.00/M

Speed

—

TTFT

—

Benchmark Scores

Intelligence Index

External Benchmarks

AA-Omniscience Accuracy

How Mistral Large 2411 Compares

Axes

X Axis

Y Axis

Bubble Size

Filters

Blended Price (USD)$0.00 – $30.0

AgMoBench Overall≥ 3.5

Providers

ai21-labsalibabaanthropicawsazurebaiducoheredeepseek

Show quadrants

anthropic

openai

google

meta

mistral

nvidia

kimi

xai

azure

deepseek

aws

cohere

baidu

ai21-labs

zai

reka-ai

xiaomi

alibaba

minimax

ibm

Bubble size = Context Window

16384.00

2000000.00

Compare with other models

GPQA Diamond

— / 100

LiveCodeBench

— / 100

Terminal-Bench Hard

— / 100

τ²-Bench

— / 100

AA-Omniscience Hallucination RatePredicted

93.3 / 100

Aider PolyglotPredicted

14.9 / 100

AIMEPredicted

0.2 / 30

AIME 2025Predicted

0.1 / 30

AlpacaEval 2.0 LCPredicted

43.5 / 100

AlpacaEval 2.0 RawPredicted

34.3 / 100

ARC-AGI-1Predicted

0.9 / 100

ARC-AGI-1 Cost per TaskPredicted

0.0

ARC-AGI-2Predicted

0.0 / 100

ARC-AGI-2 Cost per TaskPredicted

0.0

BigCodeBench CompletePredicted

61.7 / 100

BigCodeBench InstructPredicted

51.6 / 100

AA Intelligence Index (Matrix)Predicted

64.9

AA Long Context Reasoning (Matrix)Predicted

68.1

AIME 2024Predicted

36.0

AIME 2025 (Matrix)Predicted

10.4

Arena-Hard AutoPredicted

59.3

BrowseCompPredicted

49.5

BRUMO 2025Predicted

47.0

CMIMC 2025Predicted

53.8

GPQA Diamond (Matrix)Predicted

50.3

HLE (Matrix)Predicted

7.6

HMMT Feb 2025Predicted

21.8

HMMT Nov 2025Predicted

86.2

HumanEvalPredicted

78.5

IFBench (Matrix)Predicted

26.1

IFEvalPredicted

79.0

IMO 2025Predicted

6.3

LiveCodeBench (Matrix)Predicted

40.6

MATH-500 (Matrix)Predicted

90.8

MathArena Apex 2025Predicted

0.3

MMLU-Pro (Matrix)Predicted

64.5

MMMU-ProPredicted

80.8

MRCR v2Predicted

71.7

OSWorldPredicted

27.2

SimpleQAPredicted

13.5

SMT 2025Predicted

67.7

SWE-bench ProPredicted

30.8

Tau-Bench Telecom (Matrix)Predicted

92.5

Terminal-Bench 2.0Predicted

9.7

Terminal-Bench 1.0Predicted

9.2

USAMO 2025Predicted

1.6

Video-MMUPredicted

86.4

browsecompPredicted

45.0

BullshitBenchPredicted

4.9 / 100

Aider PolyglotPredicted

0.0

Apex AgentsPredicted

1.8

Arc Agi 2Predicted

0.0

BIG-Bench HardPredicted

3.0

CAD-EvalPredicted

7.3

Chess PuzzlesPredicted

0.1

CyBenchPredicted

0.1

DeepResearchBenchPredicted

0.3

FictionLiveBenchPredicted

0.3

GeoBenchPredicted

0.0

GSM8K (Epoch)Predicted

57.4

HellaSwagPredicted

73.9

Lech Mazur WritingPredicted

6.8

METR Time HorizonsPredicted

0.1

PosttrainbenchPredicted

0.0

SimpleQA Verified (Epoch)Predicted

0.2

The Agent CompanyPredicted

1.2

TriviaQAPredicted

1.6

WinoGrandePredicted

0.8

FrontierMathPredicted

7.4 / 100

GAIA Level 1Predicted

30.8

GAIA Level 2Predicted

13.8

GAIA Level 3Predicted

0.2

GAIAPredicted

19.7 / 100

GPQA DiamondPredicted

0.4 / 100

HLEPredicted

0.0 / 100

IFBenchPredicted

0.3 / 100

LCRPredicted

0.0 / 100

LegalBenchPredicted

88.5 / 100

LiveBench CodingPredicted

59.5 / 100

LiveBench Data AnalysisPredicted

30.7 / 100

LiveBench LanguagePredicted

37.6 / 100

LiveBench MathPredicted

45.3 / 100

LiveBench OverallPredicted

32.0 / 100

LiveBench ReasoningPredicted

22.4 / 100

LiveCodeBenchPredicted

0.3 / 100

LongBench v2 EasyPredicted

39.9

LongBench v2 HardPredicted

37.3

LongBench v2Predicted

34.1 / 100

MATH-500Predicted

0.8 / 100

MathVistaPredicted

56.0 / 100

MedQA (USMLE)Predicted

74.5

MLE-benchPredicted

9.0 / 100

MMLU ProPredicted

0.7 / 100

MMMUPredicted

61.1 / 100

MT-BenchPredicted

7.9 / 10

NoLiMa (NIAH)Predicted

92.8 / 100

OCRBench v2Predicted

81.3 / 100

Open LLM AveragePredicted

51.1 / 100

Open LLM: BBHPredicted

71.0 / 100

Open LLM: GPQAPredicted

37.0 / 100

Open LLM: IFEvalPredicted

79.9 / 100

Open LLM: MATH Level 5Predicted

58.1 / 100

Open LLM: MMLU-PROPredicted

58.0 / 100

Open LLM: MUSRPredicted

46.4 / 100

RE-BenchPredicted

0.0

SciCodePredicted

0.3 / 100

SimpleBenchPredicted

20.5 / 100

simpleqaPredicted

14.0

SWE-bench LitePredicted

11.2 / 100

SWE-bench VerifiedPredicted

25.6 / 100

τ²-BenchPredicted

0.0 / 100

tau-bench RetailPredicted

67.9 / 100

Terminal-Bench HardPredicted

0.0 / 100

WebArenaPredicted

16.7 / 100

WeirdMLPredicted

16.0 / 100

WildBenchPredicted

47.8

BFCL (Berkeley Function Calling)bfcl

38.4

Arena ELO: Codingchatbot_arena

309.0

Chatbot Arena ELOchatbot_arena

205.0

OTIS Mock AIME 2024–2025epoch_ai

0.1

MMTU Table Understandingmmtu

44.6 / 100

Vectara Factual Consistencyvectara_hallucination

95.5 / 100

Vectara Hallucination Ratevectara_hallucination

4.5 / 100