Kimi Linear 48B A3B Instruct

October 30, 2025Last synced Jun 12, 2026, 8:42 PM

Human Frontier

—

Human-calibrated frontier signal, backed by Arena-style preference evidence and separate from raw AgMoBench benchmark composite scores.

Blended Price

Free/M

Input Price

Free/M

Output Price

Free/M

Speed

—

TTFT

—

Benchmark Scores

Intelligence Index

Performance Radar

Kimi Linear 48B A3B Instruct

Field Average

External Benchmarks

AA-Omniscience Accuracy

How Kimi Linear 48B A3B Instruct Compares

Axes

X Axis

Y Axis

Bubble Size

Filters

Blended Price (USD)$0.00 – $37.5

AgMoBench Overall≥ 2.0

Providers

ai2ai21-labsalibabaanthropicarceeawsazurebaidu

Show quadrants

alibaba

mistral

anthropic

openai

meta

liquidai

nvidia

azure

google

deepseek

stepfun

cohere

minimax

ibm

nous-research

multiversecomputing

kimi

aws

zai

deepcogito

kwaikat

xai

xiaomi

ai21-labs

inclusionai

baidu

sarvam

prime-intellect

bytedance_seed

inception

upstage

reka-ai

tencent

arcee

ai2

swiss-ai-initiative

perplexity

Bubble size = Context Window

8191.00

2000000.00

Compare with other models

GPQA Diamond

0.4 / 100

LiveCodeBench

0.4 / 100

Terminal-Bench Hard

0.1 / 100

τ²-Bench

0.0 / 100

AA-Omniscience Hallucination RatePredicted

93.8 / 100

Aider PolyglotPredicted

15.0 / 100

AIMEPredicted

0.2 / 30

AlpacaEval 2.0 LCPredicted

40.2 / 100

AlpacaEval 2.0 RawPredicted

31.6 / 100

ARC-AGI-1Predicted

1.4 / 100

ARC-AGI-1 Cost per TaskPredicted

0.0

ARC-AGI-2Predicted

0.0 / 100

ARC-AGI-2 Cost per TaskPredicted

0.0

BFCL (Berkeley Function Calling)Predicted

32.6

BigCodeBench CompletePredicted

57.8 / 100

BigCodeBench InstructPredicted

47.8 / 100

AA Intelligence Index (Matrix)Predicted

67.2

AA Long Context Reasoning (Matrix)Predicted

69.1

AIME 2024Predicted

35.3

AIME 2025 (Matrix)Predicted

14.5

Arena-Hard AutoPredicted

53.6

BrowseCompPredicted

54.6

BRUMO 2025Predicted

61.8

CMIMC 2025Predicted

60.4

GPQA Diamond (Matrix)Predicted

49.7

HLE (Matrix)Predicted

9.0

HMMT Feb 2025Predicted

25.7

HMMT Nov 2025Predicted

87.4

HumanEvalPredicted

78.0

IFBench (Matrix)Predicted

27.0

IFEvalPredicted

78.5

IMO 2025Predicted

8.0

LiveCodeBench (Matrix)Predicted

39.6

MATH-500 (Matrix)Predicted

90.3

MathArena Apex 2025Predicted

0.4

MMLU-Pro (Matrix)Predicted

71.8

MMMU-ProPredicted

80.3

MRCR v2Predicted

72.9

OSWorldPredicted

36.9

SimpleQAPredicted

15.8

SMT 2025Predicted

71.8

SWE-bench ProPredicted

33.3

Tau-Bench Telecom (Matrix)Predicted

93.9

Terminal-Bench 2.0Predicted

13.3

Terminal-Bench 1.0Predicted

10.6

USAMO 2025Predicted

4.0

Video-MMUPredicted

86.1

browsecompPredicted

51.1

BullshitBenchPredicted

9.1 / 100

Aider PolyglotPredicted

0.0

Apex AgentsPredicted

2.0

Arc Agi 2Predicted

0.0

BIG-Bench HardPredicted

3.0

CAD-EvalPredicted

7.4

Chess PuzzlesPredicted

0.1

CyBenchPredicted

0.1

DeepResearchBenchPredicted

0.3

FictionLiveBenchPredicted

0.3

GeoBenchPredicted

0.0

GSM8K (Epoch)Predicted

16.6

HellaSwagPredicted

50.9

Lech Mazur WritingPredicted

6.8

METR Time HorizonsPredicted

0.1

OTIS Mock AIME 2024–2025Predicted

0.1

PosttrainbenchPredicted

0.0

SimpleQA Verified (Epoch)Predicted

0.2

The Agent CompanyPredicted

1.1

TriviaQAPredicted

1.9

WinoGrandePredicted

0.8

FrontierMathPredicted

9.1 / 100

GAIA Level 1Predicted

26.6

GAIA Level 2Predicted

9.7

GAIA Level 3Predicted

0.1

GAIAPredicted

16.7 / 100

LegalBenchPredicted

84.4 / 100

LiveBench CodingPredicted

61.7 / 100

LiveBench Data AnalysisPredicted

34.5 / 100

LiveBench LanguagePredicted

42.5 / 100

LiveBench MathPredicted

50.6 / 100

LiveBench OverallPredicted

36.1 / 100

LiveBench ReasoningPredicted

27.3 / 100

LongBench v2 EasyPredicted

40.9

LongBench v2 HardPredicted

40.0

LongBench v2Predicted

36.1 / 100

MATH-500Predicted

0.9 / 100

MathVistaPredicted

63.3 / 100

MedQA (USMLE)Predicted

75.0

MLE-benchPredicted

11.6 / 100

MMMUPredicted

60.3 / 100

MMTU Table UnderstandingPredicted

45.8 / 100

MT-BenchPredicted

7.9 / 10

NoLiMa (NIAH)Predicted

91.9 / 100

OCRBench v2Predicted

79.0 / 100

Open LLM AveragePredicted

45.8 / 100

Open LLM: BBHPredicted

69.6 / 100

Open LLM: GPQAPredicted

35.8 / 100

Open LLM: IFEvalPredicted

78.2 / 100

Open LLM: MATH Level 5Predicted

50.9 / 100

Open LLM: MMLU-PROPredicted

55.9 / 100

Open LLM: MUSRPredicted

45.4 / 100

RE-BenchPredicted

0.0

SimpleBenchPredicted

16.7 / 100

simpleqaPredicted

15.6

SWE-bench LitePredicted

10.8 / 100

SWE-bench VerifiedPredicted

27.3 / 100

tau-bench RetailPredicted

71.7 / 100

Vectara Factual ConsistencyPredicted

94.5 / 100

Vectara Hallucination RatePredicted

5.5 / 100

WebArenaPredicted

9.6 / 100

WeirdMLPredicted

16.9 / 100

WildBenchPredicted

53.0