Anfang 2026 lieferte NousResearch den Hermes Agent mit einer These jenseits größerer Modelle: „der Agent, der mit Ihnen wächst“. Grundlage ist das Skills-System — standardisiertes, evolvierbares, sitzungsübergreifendes prozedurales Gedächtnis, kein Einmal-Prompt.
Dieser Guide richtet sich an Entwickler, die Hermes bereits betreiben und SKILL.md-Dateien schreiben, Skill Taps veröffentlichen, Workflows bündeln und Skills mit GEPA weiterentwickeln wollen. Sie erhalten die Skills-vs-Memory-vs-Prompt-Karte, die agentskills.io-Struktur, Progressive-Disclosure-Stufen, bedingte Aktivierung, Open-Source-Hubs, Tap-Publishing, DSPy+GEPA-Fünf-Phasen-Evolution, eine Blog-Workflow-Fallstudie und FAQ. Nach dem Lesen sollten Sie produktionsreife Skills ausrollen und entscheiden können, wann ~/.hermes/ auf einem dauerhaft online Mac gehört — inklusive Einordnung, wann DSGVO-Anforderungen bei Cloud-APIs und Skill-Inhalten relevant werden.
01 Warum Hermes Agent Skills eine vertiefte Betrachtung verdienen: Schmerzpunkte und Konzeptkarte
Im Vergleich zum Einfügen langer Prompts in jeder Sitzung lösen Hermes Skills die Frage, wie prozedurales Wissen persistiert, bei Bedarf geladen und im Team skaliert wird. Typische Schmerzpunkte:
- Kontext-Blähung: Runbooks im System-Prompt zu parken frisst Tokens, die für echte Arbeit fehlen.
- Keine sitzungsübergreifende Wiederverwendung: PR-Checklisten verschwinden, wenn der Chat schließt.
- Team-Drift: Jeder pflegt eine andere lokale Prompt-Variante.
- Falsche Skills sichtbar: Free-Search-Fallbacks bleiben gelistet, obwohl bezahltes
web_searchverfügbar ist. - Stagnierende Qualität: Skills verbessern sich nicht aus Fehler-Traces.
Merkhilfe: Prompt = Haftnotiz; Memory = Notizbuch; Skill = SOP-Handbuch, das Sie bei Bedarf öffnen.
| Dimension | Prompt | Memory | Skills |
|---|---|---|---|
| Persistenz | Aktueller Chat | Sitzungsübergreifend, dauerhaft | Sitzungsübergreifend, dauerhaft |
| Ladezeitpunkt | Immer im Kontext | Pro Sitzung injiziert | Bei Bedarf |
| Token-Kosten | Jeder Turn | Klein, stabil | Null bis zur Aktivierung |
| Inhaltstyp | Beliebige Absicht | Präferenzen, Fakten | Prozedurale Schritte |
| Teilbarkeit | Umständlich | Privat | Als Tap veröffentlichbar |
Skills vs MCP: Skills lehren Vorgehen; MCP liefert Tool-APIs. Kombinieren Sie einen MCP-Datenbank-Connector mit einem Migrations-Skill, der Reihenfolge und Verifikation definiert.
Für EU-Teams ist relevant: Skills liegen lokal unter ~/.hermes/skills/ und enthalten oft interne Runbooks oder personenbezogene Kontexte. Gegenüber SaaS-Copiloten, deren Prompt-Inhalte in US-Cloud-Regionen landen können, erleichtert das die DSGVO-Einordnung — vorausgesetzt, Sie kontrollieren Host, Backup-Ziel und Löschkonzept. LLM-API-Aufrufe beim Skill-Ausführen fließen dennoch zu OpenRouter, Anthropic oder anderen Anbietern; dokumentieren Sie Auftragsverarbeitung separat.
02 SKILL.md-Format und Progressive-Disclosure-Dreistufen-Laden
Hermes Skills folgen dem offenen Standard agentskills.io und portieren zwischen Hermes, Claude Code, Cursor und OpenCode. Typisches Layout:
├── SKILL.md
├── references/
├── templates/
└── scripts/
| Stufe | Inhalt | Auslöser | Token-Kosten |
|---|---|---|---|
| Level 0 | name + description |
Sitzungsstart, alle Skills | ~3K gesamt |
| Level 1 | Vollständiger SKILL.md-Body | /skill-name oder Modell-Match |
Dateilänge |
| Level 2 | references/, scripts/ |
Während der Ausführung | Pro Datei |
Authoring-Tipp: description ist das gesamte Level-0-Signal. Beginnen Sie mit Use when..., nicht mit vagen Labels. Größenleitfaden: <500 Zeilen in SKILL.md; 500–1000 Details nach references/ verschieben; >15KB bricht GEPA-Guardrails.
03 Hermes Skill Bundles Workflow und bedingte Skill-Aktivierung
Skill Bundles (2026) packen verwandte Skills in einen Slash-Befehl unter ~/.hermes/skill-bundles/<slug>.yaml. /bundle-name lädt alle gelisteten Skills auf einmal.
name: backend-dev
description: Full backend feature workflow.
skills:
- github-code-review
- test-driven-development
- github-pr-workflow
instruction: |
Always write failing tests first.
Never push directly to main.
Bundle-Regeln: Bundle gewinnt gegen einen Skill gleichen Namens; fehlende Skills werden mit Hinweis übersprungen; Bundles schreiben den System-Prompt nicht um (cache-freundlich).
Bedingte Aktivierung in metadata.hermes:
| Feld | Verhalten |
|---|---|
requires_toolsets |
Verbergen, wenn gelistetes Toolset fehlt |
requires_tools |
Verbergen, wenn gelistetes Tool fehlt |
fallback_for_toolsets |
Verbergen, wenn gelistetes Toolset existiert (Fallback) |
fallback_for_tools |
Verbergen, wenn gelistetes Tool existiert |
Beispiel: DuckDuckGo-Search-Skill mit fallback_for_tools: [web_search] verschwindet, wenn bezahlte Search-Keys konfiguriert sind. Nach Setzen von FIRECRAWL_KEY oder BRAVE_SEARCH_KEY aktiviert sich web_search; der Free-Fallback blendet sich aus und spart Tokens. Fehlt die API, taucht der Fallback wieder auf. Plattform-Skills nutzen requires_toolsets: [messaging] mit platforms: [telegram, discord], um Messaging-Kanäle einzugrenzen.
04 Skills-Hub-Ökosystem und Hermes Skill Tap veröffentlichen
Offizielle Installationskanäle (nach Releases erneut prüfen):
hermes skills install official/research/arxiv
hermes skills install https://example.com/SKILL.md --name my-skill
hermes skills install github:openai/skills/k8s
hermes skills tap add github:my-org/my-skills
hermes skills tap update
hermes skills tap list
| Repository | Highlight |
|---|---|
| ChuckSRQ/awesome-hermes-skills | Kuratierte Produktions-Skills, MLOps, Apple-Integrationen |
| amanning3390/hermeshub | Community-Registry mit Security-Scanning |
| kevinnft/ai-agent-skills | 191 Skills, Cross-Agent-Install-Skripte |
| NousResearch/hermes-agent | Offizielle Quelle und Authoring-Spec |
Skill Tap veröffentlichen: Legen Sie ein GitHub-Repository als Tap an; das Team abonniert per Befehl. Tap-Repositories nutzen skills.sh.json für Hub-Gruppierungen:
{
"groupings": [
{
"title": "MLOps & Model Deployment",
"skills": ["vllm-deploy", "model-benchmark"]
}]
}
Team-Deployment:
hermes skills tap add github:your-org/your-skills-tap
hermes skills tap add github:your-org/private-skills --token $GH_TOKEN
cd ~/.hermes/skills && git init && git push -u origin main
git pull && hermes skills reset
Private Taps mit internen Runbooks erfordern für EU-Teams eine klare Zugriffskontrolle auf das GitHub-Repository und eine DSGVO-konforme Einordnung: Wer darf Skills mit personenbezogenen Beispielen lesen, und welche Cloud-APIs werden beim Ausführen angerufen? Befehle und Verhalten folgen der Upstream-Dokumentation; nach Releases erneut prüfen.
05 GEPA erklärt: Hermes Self-Evolving Skills ohne Modellgewichte anzufassen
GEPA (Genetic-Pareto Prompt Evolution) — ICLR-2026-Oral-Arbeit, integriert in hermes-agent-self-evolution. Es verbessert SKILL.md-Text über Ausführungs-Traces und multi-objektive Pareto-Suche, nicht über Weight-Fine-Tuning. Typischer Lauf: 2–10 USD API-Kosten, keine GPU.
Fünf Phasen:
- Trace-Sammlung: Vollständige Reasoning-Traces aus SQLite (Tool-Calls, Verzweigungen, Fehler).
- Reflektive Fehleranalyse: LLM liefert handlungsrelevante Ursachen — nicht nur „fehlgeschlagen“, sondern warum.
- Gezielte Mutation: 10–20 SKILL.md-Varianten zu den Fehlerursachen.
- Pareto-Evaluierung: Erfolgsrate, Token-Effizienz und Geschwindigkeit gleichzeitig optimieren.
- Human-reviewed PR: Beste Variante als PR; nach Freigabe live.
git clone https://github.com/NousResearch/hermes-agent-self-evolution
cd hermes-agent-self-evolution && pip install -r requirements.txt
export HERMES_AGENT_PATH=~/.hermes
python -m evolution.skills.evolve_skill \
--skill github-code-review \
--iterations 10 \
--eval-source synthetic
python -m evolution.skills.evolve_skill \
--skill github-code-review \
--iterations 10 \
--eval-source sessiondb
python -m evolution.skills.evolve_skill \
--skill github-code-review \
--iterations 10 \
--eval-source mixed \
--trace-dirs ~/.claude/traces,~/.hermes/sessions
Vier Guardrails (alle Varianten müssen bestehen):
- Volle Test-Suite:
pytest tests/ -qmuss 100 % grün sein. - Größenlimit: Skills ≤15KB, Tool-Beschreibungen ≤500 Zeichen.
- Prompt-Cache-Kompatibilität: Keine Mid-Session-Änderungen, die den Cache invalidieren.
- Semantik-Check: Kein Drift vom ursprünglichen Skill-Zweck.
Roadmap: Phase 1 SKILL.md erledigt; Tool-Beschreibungen, System-Prompts, Tool-Code und vollautomatische Schleife geplant. GEPA-Traces können personenbezogene Chat-Inhalte enthalten — speichern Sie SQLite-Exports und Session-Logs auf einem Host mit dokumentiertem Löschkonzept; bei Cloud-Eval-APIs prüfen Sie DSGVO-Auftragsverarbeitung und Drittlandtransfer.
06 Plugin-Skills, fortgeschrittenes Authoring und Blog-Workflow-Fallstudie
Plugin-Skills laden als plugin:skill, nur opt-in, mit Geschwister-Bewusstsein im Plugin-Namespace. In plugin.yaml deklarieren:
name: my-hermes-plugin
skills:
- name: writing-plans
path: skills/writing-plans/SKILL.md
- name: editing
path: skills/editing/SKILL.md
Authoring-Highlights:
descriptionsteuert Aktivierung: Keine vagen Labels wie „Helps with code“; klare Trigger und Ausschlüsse.- Pitfalls als Qualitätshebel: Konkrete Fehlermuster, Ursachen und Fixes statt Allgemeinplätze.
- Skripte: In Procedure die auszuführenden
scripts/-Befehle nennen; bei Fehlernreferences/als manuellen Fallback laden. skill_manage: Agent patcht mitskill_manage(action='patch'|'create'); bei Bedarfagent_writes_require_approval: trueinconfig.yaml.
Blog-Workflow-Fallstudie — Beispiel-Bundle:
name: blog-workflow
description: Full tech blog writing workflow.
skills:
- seo-keyword-research
- outline-generator
- code-example-validator
- bilingual-checker
- publish-to-platform
instruction: |
Always research SEO keywords before writing.
Ensure all code examples are tested and runnable.
07 FAQ und weiterführende Literatur zu Hermes Agent Skills
Skill-Änderungen nicht sichtbar? /reset oder Installation mit --now (Cache-Invalidierung kostet Tokens).
Ist GEPA sicher? Guardrails plus menschliches PR-Review; dennoch jeden Diff prüfen.
In Claude Code wiederverwenden? Nach ~/.claude/skills/ kopieren oder kevinnft/ai-agent-skills nutzen.
Deutscher Skill-Body? Token-Kosten ähnlich; description besser auf Englisch für schärfere Matches.
08 Sechs-Schritte-Rollout, Referenzmetriken und CALMVPS-Abschluss
- Hermes-Baseline:
hermes doctorbestehen;~/.hermes/skills/sichern. - Taps installieren:
hermes skills tap addundtap update. - SKILL.md schreiben: agentskills.io-Frontmatter, Procedure, Pitfalls, Verification.
- Bundle anlegen: YAML unter
skill-bundles/;/bundle-nametesten. - Bedingte Regeln:
fallback_for_toolsfür Paid/Free-Search-Paare verdrahten. - Optional GEPA:
evolve_skillmit synthetic oder sessiondb; reviewed PRs mergen.
- Level-0-Footprint: ~3K Tokens für alle Skill-Namen und -Beschreibungen.
- GEPA-Laufkosten: ~2–10 USD API, keine GPU (Upstream-README).
- GEPA-Größenlimit: Skills ≤15KB.
- agentskills.io: Validierung mit
skills-ref validate.
Laptop-Tests funktionieren; Gateway, Cron-Jobs und GEPA-Traces brauchen einen dauerhaft online Host. Pi-I/O limitiert Browser-Automation; x86-VPS fehlen macOS-only-Toolchains; Sleep bricht Skill-Compounding.
Für 24/7-Hermes, stabile Skill-Traces, iOS-CI/CD und Agent-Automation ist CALMVPS Bare-Metal Mac-mini-Miete meist der bessere Produktions-Default: dediziertes Apple Silicon, launchd-Persistenz, SSH-backup-freundliches ~/.hermes/, monatliche Elastizität, ~120s Bereitstellung. Skills und Session-Daten bleiben auf dem gewählten Host — ein zentraler DSGVO-Hebel gegenüber reinem SaaS. Siehe Mietpreise und Mac mini M4 bestellen.