Shaberi3 ベンチマーク

LLMパフォーマンス比較ダッシュボード

Upload CSV File

あなたのベンチマーク結果を可視化したい場合は、shaberi/results/totals.csvをアップロードしてください

Select Models

Select Metrics

Weighted Mean

ELYZA-tasks-100

MT-Bench

Tengu-Bench