Writer: Palmyra X5

Last synced Apr 7, 2026, 2:03 PM1040K context

Blended Price

$1.95/M

Input Price

$0.60/M

Output Price

$6.00/M

Speed

—

TTFT

—

Benchmark Scores

Intelligence Index

External Benchmarks

AA-Omniscience Accuracy

How Writer: Palmyra X5 Compares

Axes

X Axis

Y Axis

Bubble Size

Filters

Blended Price (USD)$0.00 – $30.0

AgMoBench Overall≥ 3.5

Providers

ai21-labsalibabaanthropicawsazurebaiducoheredeepseek

Show quadrants

anthropic

openai

google

meta

mistral

nvidia

kimi

xai

azure

deepseek

aws

cohere

baidu

ai21-labs

zai

reka-ai

xiaomi

alibaba

minimax

ibm

Bubble size = Context Window

16384.00

2000000.00

Compare with other models

GPQA Diamond

— / 100

LiveCodeBench

— / 100

Terminal-Bench Hard

— / 100

τ²-Bench

— / 100

AA-Omniscience Hallucination RatePredicted

96.5 / 100

Aider PolyglotPredicted

52.0 / 100

AIMEPredicted

0.1 / 30

AIME 2025Predicted

0.4 / 30

AlpacaEval 2.0 LCPredicted

28.3 / 100

AlpacaEval 2.0 RawPredicted

22.2 / 100

ARC-AGI-1Predicted

34.4 / 100

ARC-AGI-1 Cost per TaskPredicted

0.2

ARC-AGI-2Predicted

1.1 / 100

ARC-AGI-2 Cost per TaskPredicted

0.2

BFCL (Berkeley Function Calling)Predicted

42.4

BigCodeBench CompletePredicted

46.6 / 100

BigCodeBench InstructPredicted

37.3 / 100

AA Intelligence Index (Matrix)Predicted

62.6

AA Long Context Reasoning (Matrix)Predicted

73.5

AIME 2024Predicted

87.9

AIME 2025 (Matrix)Predicted

94.1

Arena-Hard AutoPredicted

65.4

BrowseCompPredicted

70.8

BRUMO 2025Predicted

96.6

CMIMC 2025Predicted

85.3

GPQA Diamond (Matrix)Predicted

75.0

HLE (Matrix)Predicted

23.8

HMMT Feb 2025Predicted

76.6

HMMT Nov 2025Predicted

91.5

HumanEvalPredicted

88.7

IFBench (Matrix)Predicted

47.2

IFEvalPredicted

86.4

IMO 2025Predicted

25.6

LiveCodeBench (Matrix)Predicted

65.1

MATH-500 (Matrix)Predicted

95.9

MathArena Apex 2025Predicted

2.6

MMLU-Pro (Matrix)Predicted

79.0

MMMU-ProPredicted

80.1

MRCR v2Predicted

78.1

OSWorldPredicted

53.1

SimpleQAPredicted

39.1

SMT 2025Predicted

87.6

SWE-bench ProPredicted

43.8

Tau-Bench Telecom (Matrix)Predicted

97.5

Terminal-Bench 2.0Predicted

39.2

Terminal-Bench 1.0Predicted

26.4

USAMO 2025Predicted

13.0

Video-MMUPredicted

85.9

browsecompPredicted

69.7

BullshitBenchPredicted

26.6 / 100

Aider PolyglotPredicted

0.0

Apex AgentsPredicted

2.7

Arc Agi 2Predicted

0.0

BIG-Bench HardPredicted

3.0

CAD-EvalPredicted

4.5

Chess PuzzlesPredicted

0.2

CyBenchPredicted

0.2

DeepResearchBenchPredicted

0.4

FictionLiveBenchPredicted

0.5

GeoBenchPredicted

0.0

GSM8K (Epoch)Predicted

0.4

HellaSwagPredicted

0.1

Lech Mazur WritingPredicted

7.7

METR Time HorizonsPredicted

3.3

OTIS Mock AIME 2024–2025Predicted

0.3

PosttrainbenchPredicted

0.0

SimpleQA Verified (Epoch)Predicted

0.4

The Agent CompanyPredicted

1.8

TriviaQAPredicted

7.4

WinoGrandePredicted

0.8

FrontierMathPredicted

21.4 / 100

GAIA Level 1Predicted

50.8

GAIA Level 2Predicted

24.2

GAIA Level 3Predicted

2.6

GAIAPredicted

34.6 / 100

GPQA DiamondPredicted

0.6 / 100

HLEPredicted

0.1 / 100

IFBenchPredicted

0.4 / 100

LCRPredicted

0.0 / 100

LegalBenchPredicted

75.2 / 100

LiveBench CodingPredicted

71.1 / 100

LiveBench Data AnalysisPredicted

54.3 / 100

LiveBench LanguagePredicted

65.7 / 100

LiveBench MathPredicted

73.4 / 100

LiveBench OverallPredicted

58.3 / 100

LiveBench ReasoningPredicted

57.8 / 100

LiveCodeBenchPredicted

0.4 / 100

LongBench v2 EasyPredicted

46.7

LongBench v2 HardPredicted

40.3

LongBench v2Predicted

36.7 / 100

MATH-500Predicted

0.8 / 100

MathVistaPredicted

55.2 / 100

MedQA (USMLE)Predicted

86.7

MLE-benchPredicted

38.4 / 100

MMLU ProPredicted

0.7 / 100

MMMUPredicted

73.1 / 100

MMTU Table UnderstandingPredicted

57.9 / 100

MT-BenchPredicted

7.8 / 10

NoLiMa (NIAH)Predicted

92.0 / 100

OCRBench v2Predicted

78.6 / 100

Open LLM AveragePredicted

24.1 / 100

Open LLM: BBHPredicted

52.7 / 100

Open LLM: GPQAPredicted

30.6 / 100

Open LLM: IFEvalPredicted

52.8 / 100

Open LLM: MATH Level 5Predicted

14.7 / 100

Open LLM: MMLU-PROPredicted

36.4 / 100

Open LLM: MUSRPredicted

41.2 / 100

RE-BenchPredicted

81.4

SciCodePredicted

0.2 / 100

SimpleBenchPredicted

40.7 / 100

simpleqaPredicted

35.7

SWE-bench LitePredicted

28.1 / 100

SWE-bench VerifiedPredicted

57.7 / 100

τ²-BenchPredicted

0.3 / 100

tau-bench RetailPredicted

84.6 / 100

Terminal-Bench HardPredicted

0.0 / 100

Vectara Factual ConsistencyPredicted

90.7 / 100

Vectara Hallucination RatePredicted

9.3 / 100

WebArenaPredicted

1.2 / 100

WeirdMLPredicted

39.2 / 100

WildBenchPredicted

43.0

Parameter Countepoch_ai

540350000000.0

Training Computeepoch_ai

2.5272e+24