OpenChat 3.5 (1210)

December 18, 2023Last synced Apr 7, 2026, 4:00 PM

Blended Price

Free/M

Input Price

Free/M

Output Price

Free/M

Speed

0 tok/s

TTFT

0.00s

Benchmark Scores

Intelligence Index

External Benchmarks

AA-Omniscience Accuracy

How OpenChat 3.5 (1210) Compares

Axes

X Axis

Y Axis

Bubble Size

Filters

Blended Price (USD)$0.00 – $30.0

AgMoBench Overall≥ 3.5

Providers

ai21-labsalibabaanthropicawsazurebaiducoheredeepseek

Show quadrants

anthropic

openai

google

meta

mistral

nvidia

kimi

xai

azure

deepseek

aws

cohere

baidu

ai21-labs

zai

reka-ai

xiaomi

alibaba

minimax

ibm

Bubble size = Context Window

16384.00

2000000.00

Compare with other models

GPQA Diamond

0.2 / 100

LiveCodeBench

0.1 / 100

Terminal-Bench Hard

— / 100

τ²-Bench

— / 100

AA-Omniscience Hallucination RatePredicted

96.6 / 100

Aider PolyglotPredicted

15.6 / 100

AIME 2025Predicted

0.0 / 30

AlpacaEval 2.0 LCPredicted

19.7 / 100

AlpacaEval 2.0 RawPredicted

15.9 / 100

ARC-AGI-1Predicted

40.3 / 100

ARC-AGI-1 Cost per TaskPredicted

0.2

ARC-AGI-2Predicted

1.5 / 100

ARC-AGI-2 Cost per TaskPredicted

0.2

BFCL (Berkeley Function Calling)Predicted

22.9

BigCodeBench CompletePredicted

29.2 / 100

BigCodeBench InstructPredicted

22.9 / 100

AA Intelligence Index (Matrix)Predicted

51.7

AA Long Context Reasoning (Matrix)Predicted

75.9

AIME 2024Predicted

11.8

AIME 2025 (Matrix)Predicted

72.3

Arena-Hard AutoPredicted

16.8

BrowseCompPredicted

84.8

BRUMO 2025Predicted

99.3

CMIMC 2025Predicted

92.1

GPQA Diamond (Matrix)Predicted

44.1

HLE (Matrix)Predicted

58.5

HMMT Feb 2025Predicted

63.1

HMMT Nov 2025Predicted

93.6

HumanEvalPredicted

66.6

IFBench (Matrix)Predicted

34.3

IFEvalPredicted

74.3

IMO 2025Predicted

36.5

LiveCodeBench (Matrix)Predicted

32.1

MATH-500 (Matrix)Predicted

84.8

MathArena Apex 2025Predicted

11.5

MMLU-Pro (Matrix)Predicted

41.7

MMMU-ProPredicted

77.8

MRCR v2Predicted

80.5

OSWorldPredicted

32.2

SimpleQAPredicted

37.0

SMT 2025Predicted

81.7

SWE-bench ProPredicted

22.5

Tau-Bench Telecom (Matrix)Predicted

98.7

Terminal-Bench 2.0Predicted

67.2

Terminal-Bench 1.0Predicted

26.4

USAMO 2025Predicted

9.0

Video-MMUPredicted

84.1

browsecompPredicted

86.5

BullshitBenchPredicted

59.4 / 100

Aider PolyglotPredicted

0.1

Apex AgentsPredicted

4.0

Arc Agi 2Predicted

0.3

BIG-Bench HardPredicted

3.0

CAD-EvalPredicted

8.3

Chess PuzzlesPredicted

0.3

CyBenchPredicted

0.1

DeepResearchBenchPredicted

0.4

FictionLiveBenchPredicted

0.5

GeoBenchPredicted

0.0

GSM8K (Epoch)Predicted

0.0

HellaSwagPredicted

0.2

Lech Mazur WritingPredicted

6.9

METR Time HorizonsPredicted

5.0

OTIS Mock AIME 2024–2025Predicted

0.0

PosttrainbenchPredicted

0.0

SimpleQA Verified (Epoch)Predicted

0.5

The Agent CompanyPredicted

0.9

TriviaQAPredicted

13.1

WinoGrandePredicted

0.6

FrontierMathPredicted

33.5 / 100

GAIA Level 1Predicted

7.1

GAIA Level 2Predicted

0.6

GAIA Level 3Predicted

0.0

GAIAPredicted

4.3 / 100

IFBenchPredicted

0.2 / 100

LCRPredicted

0.0 / 100

LegalBenchPredicted

27.7 / 100

LiveBench CodingPredicted

76.1 / 100

LiveBench Data AnalysisPredicted

64.6 / 100

LiveBench LanguagePredicted

76.5 / 100

LiveBench MathPredicted

82.9 / 100

LiveBench OverallPredicted

68.8 / 100

LiveBench ReasoningPredicted

71.6 / 100

LongBench v2 EasyPredicted

29.1

LongBench v2 HardPredicted

25.1

LongBench v2Predicted

29.2 / 100

MathVistaPredicted

44.5 / 100

MedQA (USMLE)Predicted

55.8

MLE-benchPredicted

52.1 / 100

MMMUPredicted

53.7 / 100

MMTU Table UnderstandingPredicted

54.1 / 100

MT-BenchPredicted

7.7 / 10

NoLiMa (NIAH)Predicted

82.4 / 100

OCRBench v2Predicted

56.5 / 100

RE-BenchPredicted

99.5

SciCodePredicted

0.0 / 100

SimpleBenchPredicted

34.5 / 100

simpleqaPredicted

31.6

SWE-bench LitePredicted

8.1 / 100

SWE-bench VerifiedPredicted

42.9 / 100

τ²-BenchPredicted

0.0 / 100

tau-bench RetailPredicted

90.4 / 100

Terminal-Bench HardPredicted

0.0 / 100

Vectara Factual ConsistencyPredicted

88.8 / 100

Vectara Hallucination RatePredicted

11.2 / 100

WebArenaPredicted

0.8 / 100

WeirdMLPredicted

17.8 / 100

WildBenchPredicted

30.1

Open LLM Averageopen_llm_leaderboard

21.6 / 100

Open LLM: BBHopen_llm_leaderboard

44.3 / 100

Open LLM: GPQAopen_llm_leaderboard

29.9 / 100

Open LLM: IFEvalopen_llm_leaderboard

59.3 / 100

Open LLM: MATH Level 5open_llm_leaderboard

7.3 / 100

Open LLM: MMLU-PROopen_llm_leaderboard

31.5 / 100

Open LLM: MUSRopen_llm_leaderboard

42.3 / 100