Models Agents EvalsIndustry

AgMoDB by @mistakeknot

Mistral: Mistral 7B Instruct v0.1 | AgMoDB

Mistral: Mistral 7B Instruct v0.1

Last synced Apr 7, 2026, 2:04 PM3K context

Blended Price

$0.13/M

Input Price

$0.11/M

Output Price

$0.19/M

Speed

—

TTFT

—

Benchmark Scores

Intelligence Index

External Benchmarks

AA-Omniscience Accuracy

How Mistral: Mistral 7B Instruct v0.1 Compares

Axes

X Axis

Y Axis

Bubble Size

Filters

Blended Price (USD)$0.00 – $30.0

AgMoBench Overall≥ 3.5

Providers

ai21-labsalibabaanthropicawsazurebaiducoheredeepseek

Show quadrants

anthropic

openai

google

meta

mistral

nvidia

kimi

xai

azure

deepseek

aws

cohere

baidu

ai21-labs

zai

reka-ai

xiaomi

alibaba

minimax

ibm

Bubble size = Context Window

16384.00

2000000.00

Compare with other models

—

Coding Index

—

Math Index

—

MMLU Pro

— / 100

GPQA Diamond

— / 100

HLE

— / 100

LiveCodeBench

— / 100

SciCode

— / 100

MATH-500

— / 100

AIME

— / 30

AIME 2025

— / 30

IFBench

— / 100

LCR

— / 100

Terminal-Bench Hard

— / 100

τ²-Bench

— / 100

Predicted

48.5 / 100

AA-Omniscience Hallucination RatePredicted

97.8 / 100

Aider PolyglotPredicted

69.6 / 100

AIMEPredicted

0.0 / 30

AIME 2025Predicted

0.4 / 30

AlpacaEval 2.0 LCPredicted

18.4 / 100

AlpacaEval 2.0 RawPredicted

14.7 / 100

ARC-AGI-1Predicted

89.4 / 100

ARC-AGI-1 Cost per TaskPredicted

0.7

ARC-AGI-2Predicted

71.3 / 100

ARC-AGI-2 Cost per TaskPredicted

1.3

BFCL (Berkeley Function Calling)Predicted

42.5

BigCodeBench CompletePredicted

32.5 / 100

BigCodeBench InstructPredicted

25.4 / 100

AA Intelligence Index (Matrix)Predicted

55.3

AA Long Context Reasoning (Matrix)Predicted

77.3

AIME 2024Predicted

94.9

AIME 2025 (Matrix)Predicted

99.6

Arena-Hard AutoPredicted

55.9

BrowseCompPredicted

84.5

BRUMO 2025Predicted

99.8

CMIMC 2025Predicted

90.9

CritPtPredicted

20.8

GPQA Diamond (Matrix)Predicted

81.4

GSM8KPredicted

95.4

HLE (Matrix)Predicted

30.6

HMMT Feb 2025Predicted

93.4

HMMT Nov 2025Predicted

94.3

HumanEvalPredicted

90.5

IFBench (Matrix)Predicted

59.0

IFEvalPredicted

88.0

IMO 2025Predicted

53.5

LiveCodeBench (Matrix)Predicted

71.8

MATH-500 (Matrix)Predicted

96.6

MathArena Apex 2025Predicted

15.4

MMLUPredicted

87.9

MMLU-Pro (Matrix)Predicted

82.4

MMMU-ProPredicted

77.8

MRCR v2Predicted

82.2

OSWorldPredicted

72.4

SimpleQAPredicted

51.0

SMT 2025Predicted

86.6

SWE-bench ProPredicted

55.7

Tau-Bench Telecom (Matrix)Predicted

99.0

Terminal-Bench 2.0Predicted

73.8

Terminal-Bench 1.0Predicted

45.2

USAMO 2025Predicted

25.3

Video-MMUPredicted

85.1

browsecompPredicted

85.5

BullshitBenchPredicted

43.8 / 100

Aider PolyglotPredicted

0.3

Apex AgentsPredicted

4.0

Arc Agi 2Predicted

0.1

BALROGPredicted

0.0

BIG-Bench HardPredicted

3.0

BoolQPredicted

0.8

CAD-EvalPredicted

3.8

Chess PuzzlesPredicted

0.4

CyBenchPredicted

0.5

DeepResearchBenchPredicted

0.5

FictionLiveBenchPredicted

0.7

GdpvalPredicted

0.6

GeoBenchPredicted

0.0

GSM8K (Epoch)Predicted

0.0

GSOPredicted

0.7

HellaSwagPredicted

0.0

HlePredicted

0.2

Lech Mazur WritingPredicted

8.1

METR Time HorizonsPredicted

31.0

OTIS Mock AIME 2024–2025Predicted

0.3

PosttrainbenchPredicted

0.0

SimpleQA Verified (Epoch)Predicted

0.7

The Agent CompanyPredicted

1.9

TriviaQAPredicted

29.3

VPCTPredicted

0.7

WinoGrandePredicted

0.7

FrontierMathPredicted

28.9 / 100

GAIA Level 1Predicted

48.0

GAIA Level 2Predicted

15.4

GAIA Level 3Predicted

1.4

GAIAPredicted

31.7 / 100

GPQA DiamondPredicted

0.6 / 100

HLEPredicted

0.1 / 100

IFBenchPredicted

0.5 / 100

LCRPredicted

0.0 / 100

LegalBenchPredicted

49.1 / 100

LiveBench CodingPredicted

78.6 / 100

LiveBench Data AnalysisPredicted

71.7 / 100

LiveBench LanguagePredicted

82.4 / 100

LiveBench MathPredicted

87.6 / 100

LiveBench OverallPredicted

76.3 / 100

LiveBench ReasoningPredicted

81.7 / 100

LiveCodeBenchPredicted

0.3 / 100

LongBench v2 EasyPredicted

44.6

LongBench v2 HardPredicted

35.0

LongBench v2Predicted

34.8 / 100

MATH-500Predicted

0.7 / 100

MathVistaPredicted

52.0 / 100

MedQA (USMLE)Predicted

89.3

MLE-benchPredicted

70.8 / 100

MMLU ProPredicted

0.6 / 100

MMMUPredicted

54.7 / 100

MMTU Table UnderstandingPredicted

63.3 / 100

MT-BenchPredicted

7.8 / 10

NoLiMa (NIAH)Predicted

89.5 / 100

OCRBench v2Predicted

71.6 / 100

RE-BenchPredicted

100.0

SciCodePredicted

0.1 / 100

SimpleBenchPredicted

49.2 / 100

simpleqaPredicted

45.6

SWE-bench LitePredicted

36.0 / 100

SWE-bench VerifiedPredicted

65.4 / 100

τ²-BenchPredicted

0.5 / 100

tau-bench RetailPredicted

92.2 / 100

Terminal-Bench HardPredicted

0.0 / 100

Vectara Factual ConsistencyPredicted

85.5 / 100

Vectara Hallucination RatePredicted

14.5 / 100

WebArenaPredicted

0.0 / 100

WeirdMLPredicted

51.3 / 100

WildBenchPredicted

31.5

PIQAepoch_ai

0.8

HuggingFace Downloads (30d)hf-downloads

394087.0

HuggingFace Likeshf-downloads

1827.0

Open LLM Averageopen_llm_leaderboard

12.8 / 100

Open LLM: BBHopen_llm_leaderboard

33.5 / 100

Open LLM: GPQAopen_llm_leaderboard

25.0 / 100

Open LLM: IFEvalopen_llm_leaderboard

44.9 / 100

Open LLM: MATH Level 5open_llm_leaderboard

2.3 / 100

Open LLM: MMLU-PROopen_llm_leaderboard

24.1 / 100

Open LLM: MUSRopen_llm_leaderboard

38.5 / 100