Назад към всички

eval-harness

// Evaluation harness for testing agent and skill quality through structured benchmarks, regression tests, and quality scoring.

$ git log --oneline --stat
stars:384
forks:73
updated:March 4, 2026
SKILL.md

Този skill няма публичен SKILL.md файл.

Разгледайте в GitHub