ml-model-eval-benchmark

// Compare model candidates using weighted metrics and deterministic ranking outputs. Use for benchmark leaderboards and model promotion decisions.

$ git log --oneline --stat

stars:1,933

forks:367

updated:March 4, 2026

SKILL.md

Този skill няма публичен SKILL.md файл.