Hermes Agent Skills Advanced Guide 2026:
SKILL.md, Bundles und GEPA-Self-Evolution

Anfang 2026 lieferte NousResearch den Hermes Agent mit einer These jenseits größerer Modelle: „der Agent, der mit Ihnen wächst“. Grundlage ist das Skills-System — standardisiertes, evolvierbares, sitzungsübergreifendes prozedurales Gedächtnis, kein Einmal-Prompt.

Dieser Guide richtet sich an Entwickler, die Hermes bereits betreiben und SKILL.md-Dateien schreiben, Skill Taps veröffentlichen, Workflows bündeln und Skills mit GEPA weiterentwickeln wollen. Sie erhalten die Skills-vs-Memory-vs-Prompt-Karte, die agentskills.io-Struktur, Progressive-Disclosure-Stufen, bedingte Aktivierung, Open-Source-Hubs, Tap-Publishing, DSPy+GEPA-Fünf-Phasen-Evolution, eine Blog-Workflow-Fallstudie und FAQ. Nach dem Lesen sollten Sie produktionsreife Skills ausrollen und entscheiden können, wann ~/.hermes/ auf einem dauerhaft online Mac gehört — inklusive Einordnung, wann DSGVO-Anforderungen bei Cloud-APIs und Skill-Inhalten relevant werden.

01 Warum Hermes Agent Skills eine vertiefte Betrachtung verdienen: Schmerzpunkte und Konzeptkarte

Im Vergleich zum Einfügen langer Prompts in jeder Sitzung lösen Hermes Skills die Frage, wie prozedurales Wissen persistiert, bei Bedarf geladen und im Team skaliert wird. Typische Schmerzpunkte:

  • Kontext-Blähung: Runbooks im System-Prompt zu parken frisst Tokens, die für echte Arbeit fehlen.
  • Keine sitzungsübergreifende Wiederverwendung: PR-Checklisten verschwinden, wenn der Chat schließt.
  • Team-Drift: Jeder pflegt eine andere lokale Prompt-Variante.
  • Falsche Skills sichtbar: Free-Search-Fallbacks bleiben gelistet, obwohl bezahltes web_search verfügbar ist.
  • Stagnierende Qualität: Skills verbessern sich nicht aus Fehler-Traces.

Merkhilfe: Prompt = Haftnotiz; Memory = Notizbuch; Skill = SOP-Handbuch, das Sie bei Bedarf öffnen.

Skills vs Memory vs Prompt
Dimension Prompt Memory Skills
Persistenz Aktueller Chat Sitzungsübergreifend, dauerhaft Sitzungsübergreifend, dauerhaft
Ladezeitpunkt Immer im Kontext Pro Sitzung injiziert Bei Bedarf
Token-Kosten Jeder Turn Klein, stabil Null bis zur Aktivierung
Inhaltstyp Beliebige Absicht Präferenzen, Fakten Prozedurale Schritte
Teilbarkeit Umständlich Privat Als Tap veröffentlichbar

Skills vs MCP: Skills lehren Vorgehen; MCP liefert Tool-APIs. Kombinieren Sie einen MCP-Datenbank-Connector mit einem Migrations-Skill, der Reihenfolge und Verifikation definiert.

Für EU-Teams ist relevant: Skills liegen lokal unter ~/.hermes/skills/ und enthalten oft interne Runbooks oder personenbezogene Kontexte. Gegenüber SaaS-Copiloten, deren Prompt-Inhalte in US-Cloud-Regionen landen können, erleichtert das die DSGVO-Einordnung — vorausgesetzt, Sie kontrollieren Host, Backup-Ziel und Löschkonzept. LLM-API-Aufrufe beim Skill-Ausführen fließen dennoch zu OpenRouter, Anthropic oder anderen Anbietern; dokumentieren Sie Auftragsverarbeitung separat.

02 SKILL.md-Format und Progressive-Disclosure-Dreistufen-Laden

Hermes Skills folgen dem offenen Standard agentskills.io und portieren zwischen Hermes, Claude Code, Cursor und OpenCode. Typisches Layout:

~/.hermes/skills/my-category/my-skill/
├── SKILL.md
├── references/
├── templates/
└── scripts/
Progressive-Disclosure-Stufen
Stufe Inhalt Auslöser Token-Kosten
Level 0 name + description Sitzungsstart, alle Skills ~3K gesamt
Level 1 Vollständiger SKILL.md-Body /skill-name oder Modell-Match Dateilänge
Level 2 references/, scripts/ Während der Ausführung Pro Datei

Authoring-Tipp: description ist das gesamte Level-0-Signal. Beginnen Sie mit Use when..., nicht mit vagen Labels. Größenleitfaden: <500 Zeilen in SKILL.md; 500–1000 Details nach references/ verschieben; >15KB bricht GEPA-Guardrails.

03 Hermes Skill Bundles Workflow und bedingte Skill-Aktivierung

Skill Bundles (2026) packen verwandte Skills in einen Slash-Befehl unter ~/.hermes/skill-bundles/<slug>.yaml. /bundle-name lädt alle gelisteten Skills auf einmal.

backend-dev.yaml
name: backend-dev
description: Full backend feature workflow.
skills:
  - github-code-review
  - test-driven-development
  - github-pr-workflow
instruction: |
  Always write failing tests first.
  Never push directly to main.

Bundle-Regeln: Bundle gewinnt gegen einen Skill gleichen Namens; fehlende Skills werden mit Hinweis übersprungen; Bundles schreiben den System-Prompt nicht um (cache-freundlich).

Bedingte Aktivierung in metadata.hermes:

Aktivierungsregel-Felder
Feld Verhalten
requires_toolsets Verbergen, wenn gelistetes Toolset fehlt
requires_tools Verbergen, wenn gelistetes Tool fehlt
fallback_for_toolsets Verbergen, wenn gelistetes Toolset existiert (Fallback)
fallback_for_tools Verbergen, wenn gelistetes Tool existiert

Beispiel: DuckDuckGo-Search-Skill mit fallback_for_tools: [web_search] verschwindet, wenn bezahlte Search-Keys konfiguriert sind. Nach Setzen von FIRECRAWL_KEY oder BRAVE_SEARCH_KEY aktiviert sich web_search; der Free-Fallback blendet sich aus und spart Tokens. Fehlt die API, taucht der Fallback wieder auf. Plattform-Skills nutzen requires_toolsets: [messaging] mit platforms: [telegram, discord], um Messaging-Kanäle einzugrenzen.

04 Skills-Hub-Ökosystem und Hermes Skill Tap veröffentlichen

Offizielle Installationskanäle (nach Releases erneut prüfen):

terminal
hermes skills install official/research/arxiv
hermes skills install https://example.com/SKILL.md --name my-skill
hermes skills install github:openai/skills/k8s
hermes skills tap add github:my-org/my-skills
hermes skills tap update
hermes skills tap list
Bemerkenswerte Open-Source-Skill-Repositories (2026-06)
Repository Highlight
ChuckSRQ/awesome-hermes-skills Kuratierte Produktions-Skills, MLOps, Apple-Integrationen
amanning3390/hermeshub Community-Registry mit Security-Scanning
kevinnft/ai-agent-skills 191 Skills, Cross-Agent-Install-Skripte
NousResearch/hermes-agent Offizielle Quelle und Authoring-Spec

Skill Tap veröffentlichen: Legen Sie ein GitHub-Repository als Tap an; das Team abonniert per Befehl. Tap-Repositories nutzen skills.sh.json für Hub-Gruppierungen:

skills.sh.json
{
  "groupings": [
    {
      "title": "MLOps & Model Deployment",
      "skills": ["vllm-deploy", "model-benchmark"]
  }]
}

Team-Deployment:

terminal
hermes skills tap add github:your-org/your-skills-tap
hermes skills tap add github:your-org/private-skills --token $GH_TOKEN
cd ~/.hermes/skills && git init && git push -u origin main
git pull && hermes skills reset

Private Taps mit internen Runbooks erfordern für EU-Teams eine klare Zugriffskontrolle auf das GitHub-Repository und eine DSGVO-konforme Einordnung: Wer darf Skills mit personenbezogenen Beispielen lesen, und welche Cloud-APIs werden beim Ausführen angerufen? Befehle und Verhalten folgen der Upstream-Dokumentation; nach Releases erneut prüfen.

Skills System | Hermes Agent

agentskills.io Specification

NousResearch/hermes-agent auf GitHub

05 GEPA erklärt: Hermes Self-Evolving Skills ohne Modellgewichte anzufassen

GEPA (Genetic-Pareto Prompt Evolution) — ICLR-2026-Oral-Arbeit, integriert in hermes-agent-self-evolution. Es verbessert SKILL.md-Text über Ausführungs-Traces und multi-objektive Pareto-Suche, nicht über Weight-Fine-Tuning. Typischer Lauf: 2–10 USD API-Kosten, keine GPU.

Fünf Phasen:

  1. Trace-Sammlung: Vollständige Reasoning-Traces aus SQLite (Tool-Calls, Verzweigungen, Fehler).
  2. Reflektive Fehleranalyse: LLM liefert handlungsrelevante Ursachen — nicht nur „fehlgeschlagen“, sondern warum.
  3. Gezielte Mutation: 10–20 SKILL.md-Varianten zu den Fehlerursachen.
  4. Pareto-Evaluierung: Erfolgsrate, Token-Effizienz und Geschwindigkeit gleichzeitig optimieren.
  5. Human-reviewed PR: Beste Variante als PR; nach Freigabe live.
terminal
git clone https://github.com/NousResearch/hermes-agent-self-evolution
cd hermes-agent-self-evolution && pip install -r requirements.txt
export HERMES_AGENT_PATH=~/.hermes

python -m evolution.skills.evolve_skill \
    --skill github-code-review \
    --iterations 10 \
    --eval-source synthetic

python -m evolution.skills.evolve_skill \
    --skill github-code-review \
    --iterations 10 \
    --eval-source sessiondb

python -m evolution.skills.evolve_skill \
    --skill github-code-review \
    --iterations 10 \
    --eval-source mixed \
    --trace-dirs ~/.claude/traces,~/.hermes/sessions

Vier Guardrails (alle Varianten müssen bestehen):

  • Volle Test-Suite: pytest tests/ -q muss 100 % grün sein.
  • Größenlimit: Skills ≤15KB, Tool-Beschreibungen ≤500 Zeichen.
  • Prompt-Cache-Kompatibilität: Keine Mid-Session-Änderungen, die den Cache invalidieren.
  • Semantik-Check: Kein Drift vom ursprünglichen Skill-Zweck.

Roadmap: Phase 1 SKILL.md erledigt; Tool-Beschreibungen, System-Prompts, Tool-Code und vollautomatische Schleife geplant. GEPA-Traces können personenbezogene Chat-Inhalte enthalten — speichern Sie SQLite-Exports und Session-Logs auf einem Host mit dokumentiertem Löschkonzept; bei Cloud-Eval-APIs prüfen Sie DSGVO-Auftragsverarbeitung und Drittlandtransfer.

06 Plugin-Skills, fortgeschrittenes Authoring und Blog-Workflow-Fallstudie

Plugin-Skills laden als plugin:skill, nur opt-in, mit Geschwister-Bewusstsein im Plugin-Namespace. In plugin.yaml deklarieren:

plugin.yaml
name: my-hermes-plugin
skills:
  - name: writing-plans
    path: skills/writing-plans/SKILL.md
  - name: editing
    path: skills/editing/SKILL.md

Authoring-Highlights:

  • description steuert Aktivierung: Keine vagen Labels wie „Helps with code“; klare Trigger und Ausschlüsse.
  • Pitfalls als Qualitätshebel: Konkrete Fehlermuster, Ursachen und Fixes statt Allgemeinplätze.
  • Skripte: In Procedure die auszuführenden scripts/-Befehle nennen; bei Fehlern references/ als manuellen Fallback laden.
  • skill_manage: Agent patcht mit skill_manage(action='patch'|'create'); bei Bedarf agent_writes_require_approval: true in config.yaml.

Blog-Workflow-Fallstudie — Beispiel-Bundle:

blog-workflow.yaml
name: blog-workflow
description: Full tech blog writing workflow.
skills:
  - seo-keyword-research
  - outline-generator
  - code-example-validator
  - bilingual-checker
  - publish-to-platform
instruction: |
  Always research SEO keywords before writing.
  Ensure all code examples are tested and runnable.

07 FAQ und weiterführende Literatur zu Hermes Agent Skills

Skill-Änderungen nicht sichtbar? /reset oder Installation mit --now (Cache-Invalidierung kostet Tokens).

Ist GEPA sicher? Guardrails plus menschliches PR-Review; dennoch jeden Diff prüfen.

In Claude Code wiederverwenden? Nach ~/.claude/skills/ kopieren oder kevinnft/ai-agent-skills nutzen.

Deutscher Skill-Body? Token-Kosten ähnlich; description besser auf Englisch für schärfere Matches.

Creating Skills | Hermes Agent

hermes-agent-self-evolution

gepa-ai/gepa

08 Sechs-Schritte-Rollout, Referenzmetriken und CALMVPS-Abschluss

  1. Hermes-Baseline: hermes doctor bestehen; ~/.hermes/skills/ sichern.
  2. Taps installieren: hermes skills tap add und tap update.
  3. SKILL.md schreiben: agentskills.io-Frontmatter, Procedure, Pitfalls, Verification.
  4. Bundle anlegen: YAML unter skill-bundles/; /bundle-name testen.
  5. Bedingte Regeln: fallback_for_tools für Paid/Free-Search-Paare verdrahten.
  6. Optional GEPA: evolve_skill mit synthetic oder sessiondb; reviewed PRs mergen.
  • Level-0-Footprint: ~3K Tokens für alle Skill-Namen und -Beschreibungen.
  • GEPA-Laufkosten: ~2–10 USD API, keine GPU (Upstream-README).
  • GEPA-Größenlimit: Skills ≤15KB.
  • agentskills.io: Validierung mit skills-ref validate.

Laptop-Tests funktionieren; Gateway, Cron-Jobs und GEPA-Traces brauchen einen dauerhaft online Host. Pi-I/O limitiert Browser-Automation; x86-VPS fehlen macOS-only-Toolchains; Sleep bricht Skill-Compounding.

Für 24/7-Hermes, stabile Skill-Traces, iOS-CI/CD und Agent-Automation ist CALMVPS Bare-Metal Mac-mini-Miete meist der bessere Produktions-Default: dediziertes Apple Silicon, launchd-Persistenz, SSH-backup-freundliches ~/.hermes/, monatliche Elastizität, ~120s Bereitstellung. Skills und Session-Daten bleiben auf dem gewählten Host — ein zentraler DSGVO-Hebel gegenüber reinem SaaS. Siehe Mietpreise und Mac mini M4 bestellen.