Hamelsmu Evals Skills

hamelsmu/evals-skills · 1 plugin

Design and run LLM eval suites—datasets, rubrics, regression baselines, and failure triage—before shipping agent or prompt changes to production.

/plugin marketplace add hamelsmu/evals-skills

GitHub stars	★ 1.4k
Repository	hamelsmu/evals-skills ↗

Plugins in this marketplace

1 plugin - install individually after you add the marketplace.

PluginVersion

Evals SkillsSkills for building LLM evaluations: pipeline audit, error analysis, synthetic data generation, LLM-as-Judge design, evaluator validation, RAG evaluation, and annotation interfaces.-

Recommended Marketplaces

Aaronstatic1 plugins4

Ai Skill Test Bdd1 plugins

Anti Hall1 plugins1

Askqa Marketplace1 plugins

Atc Ai Marketplace Test1 plugins

Bee Review1 plugins

Testingllmresearch

Browse by category

AI & Agents Frontend & Design Backend & Data Dev Tools Automation Testing & Review Security Monitoring & Cloud Docs & Planning

Design & frontend

Design systems Animation & motion Accessibility (a11y)CSS & Tailwind UI design UX Design to code shadcn/ui Landing pages Best design skills

Five minutes, every Monday — the tools, releases and tactics for shipping solo.

unsubscribe anytime.