How do I sign into a different AI provider in Hermes Agent?

Hermes has three auth paths. Path 1: API key in ~/.hermes/.env for providers like OpenRouter, z.ai, Kimi, MiniMax, DeepSeek, Hugging Face, and Google. Path 2: OAuth via hermes model or hermes auth for Nous Portal, OpenAI Codex, GitHub Copilot, and Anthropic — credentials are stored in ~/.hermes/auth.json. Path 3: custom endpoint in config.yaml for any OpenAI-compatible server like Ollama, vLLM, SGLang, llama.cpp, or LM Studio. Run hermes model interactively to walk through all options.

Can I run Hermes Agent with a local LLM like Ollama or vLLM?

Yes. Hermes works with any OpenAI-compatible API endpoint — Ollama, vLLM, SGLang, llama.cpp, LM Studio, LocalAI, Jan, or your own server. Run hermes model, select Custom endpoint, enter the base URL (e.g., http://localhost:11434/v1 for Ollama) and model name. Hermes handles context length detection automatically, but watch out for low defaults on Ollama (4k) and LM Studio (2048) — raise to at least 16k-32k for agent use.

What is SOUL.md and how does it relate to AGENTS.md?

SOUL.md is the agent's primary identity — tone, voice, communication style, personality-level behavior. It lives at ~/.hermes/SOUL.md and occupies slot #1 in every system prompt. AGENTS.md is project-specific — architecture, conventions, commands, paths — and lives in your project directory. The rule: if it should follow you everywhere, it belongs in SOUL.md. If it belongs to a project, it belongs in AGENTS.md.

hermes@agent:~/.hermes$ cat hermes.md

██╗  ██╗███████╗██████╗ ███╗   ███╗███████╗███████╗       █████╗  ██████╗ ███████╗███╗   ██╗████████╗
██║  ██║██╔════╝██╔══██╗████╗ ████║██╔════╝██╔════╝      ██╔══██╗██╔════╝ ██╔════╝████╗  ██║╚══██╔══╝
███████║█████╗  ██████╔╝██╔████╔██║█████╗  ███████╗█████╗███████║██║  ███╗█████╗  ██╔██╗ ██║   ██║
██╔══██║██╔══╝  ██╔══██╗██║╚██╔╝██║██╔══╝  ╚════██║╚════╝██╔══██║██║   ██║██╔══╝  ██║╚██╗██║   ██║
██║  ██║███████╗██║  ██║██║ ╚═╝ ██║███████╗███████║      ██║  ██║╚██████╔╝███████╗██║ ╚████║   ██║
╚═╝  ╚═╝╚══════╝╚═╝  ╚═╝╚═╝     ╚═╝╚══════╝╚══════╝      ╚═╝  ╚═╝ ╚═════╝ ╚══════╝╚═╝  ╚═══╝   ╚═╝

Hermes Agent: Die Referenz für Praktiker (2026)

Q: What is Hermes Agent and how is it different from Claude Code?

Hermes Agent is an open-source self-improving AI agent from Nous Research. Unlike Claude Code which is locked to Anthropic models, Hermes works with any OpenAI-compatible provider — Nous Portal, OpenRouter, Anthropic, GitHub Copilot, z.ai, Kimi, MiniMax, DeepSeek, Hugging Face, Google, or your own self-hosted endpoint. Hermes also ships a messaging gateway for Telegram, Discord, Slack, WhatsApp, Signal, and more that Claude Code does not have.

Q: How do I switch models mid-conversation without losing history?

Use /model provider:model inside an active session. Hermes persists the conversation, memory, and skills across the switch. Examples: /model zai:glm-5, /model openrouter:anthropic/claude-sonnet-4, /model custom:local:qwen-2.5 for a named custom provider. /model custom with no model name auto-detects the model from a local endpoint's /v1/models API.

# Eine Referenz für Praktiker zu Hermes Agent, dem quelloffenen, selbstverbessernden AI-Agenten von Nous Research: Provider-Authentifizierung und OAuth, die Konfigurationsdateien, das Skills-System und der Betrieb als plattformübergreifendes Messaging-Gateway.

words: 14420 read_time: 73m updated: 2026-07-02 14:34

$ less hermes.md

Kurzfassung: Hermes Agent ist ein selbstverbessernder Open-Source-AI-Agent von Nous Research. Er läuft als CLI und als plattformübergreifendes Messaging-gateway, speichert eine dauerhafte Identität und persistente Memory auf der Festplatte, bündelt skills, die sich durch Nutzung verbessern, und arbeitet mit jedem OpenAI-kompatiblen LLM-Provider — Nous Portal, OpenRouter, Anthropic, GitHub Copilot, z.ai, Kimi, MiniMax, DeepSeek, Qwen Cloud, Hugging Face, Google, xAI/SuperGrok oder Ihrem eigenen selbst gehosteten Endpoint.¹²¹⁹ Seit v0.14.0 (16. Mai 2026) ergänzt Hermes SuperGrok OAuth mit grok-4.3 1M Context, einen OpenAI-kompatiblen lokalen proxy für OAuth-Provider (hermes proxy), erstklassiges x_search, PyPI-Installationssupport, lazy Dependency-Installationen, 22 Messaging-Plattformen mit LINE und SimpleX Chat, /handoff, semantische LSP-Diagnosen nach Schreibvorgängen, einheitliches video_generate, computer_use über cua-driver für Nicht-Anthropic-Provider, native Windows-Beta sowie 12 P0- und 50 P1-Abschlüsse.¹⁹ Der schwierigste Teil für die meisten neuen Benutzer ist die Provider-Authentifizierung: Hermes unterstützt etwa 20 erstklassige Provider plus benutzerdefinierte Endpoints und 3 verschiedene Auth-Pfade (API-Schlüssel in .env, OAuth über hermes model oder benutzerdefinierter Endpoint in config.yaml). Das Auth-Modell sollten Sie zuerst verstehen — alles andere hängt davon ab, welcher Provider aufgelöst wird.

Hermes Agent arbeitet als vollständige Agent-Runtime, nicht als Chat-Wrapper. Er liest Ihr Dateisystem, führt Befehle in sandboxed Backends aus, scraped das Web, startet Subagents, führt geplante cron-Jobs aus, kommuniziert über Telegram/Discord/Slack/WhatsApp/Signal/Email aus einem einzigen gateway-Prozess heraus und erstellt aus Erfahrung eigene skills.¹ Die CLI ist eine Terminal-UI auf Basis einer Conversation Loop in run_agent.py; das gateway ist ein lang laufender Prozess, der Nachrichten von Messaging-Plattformen durch dieselbe Conversation Loop routet.³

Der Unterschied zwischen gelegentlicher und professioneller Hermes-Nutzung liegt in 5 Systemen. Beherrschen Sie diese, wird Hermes zu einem Kraftmultiplikator:

Provider-Auflösung: wie Auth-Flows auf API-Aufrufe abgebildet werden
Konfigurationshierarchie: config.yaml + .env + auth.json + SOUL.md + AGENTS.md
Tool- + toolset-System: was der Agent tun kann, je Plattform eingeschränkt
skills-System: prozedurale Memory, die der Agent erstellt und weiterentwickelt
gateway + cron + profile: Hermes dort ausführen, wo Sie arbeiten, nicht nur dort, wo Sie gerade sind

Wichtige Erkenntnisse

Provider-Auth besteht aus 3 Pfaden, nicht aus einem. API-Schlüssel in .env, OAuth über hermes model/hermes auth oder benutzerdefinierter Endpoint in config.yaml. Wählen Sie den Pfad, der zu Ihrem Provider passt, nicht den, der Ihnen vertraut vorkommt.
Provider-Wechsel erfolgen mit einem einzigen Befehl. hermes model führt Sie interaktiv durch jeden unterstützten Provider einschließlich OAuth-Logins, und /model provider:model wechselt mitten in der Sitzung, ohne den Verlauf zu verlieren.²
2 Dateien bilden die vom Benutzer editierbare Konfigurationsoberfläche. ~/.hermes/config.yaml enthält Einstellungen, ~/.hermes/.env enthält Secrets. auth.json, SOUL.md, MEMORY.md und skills/ werden direkt von Hermes verwaltet — Sie können SOUL.md von Hand bearbeiten, den Rest verändert der Agent selbst.⁴
Hermes ist der Nachfolger von OpenClaw. Wenn Sie migrieren, importiert hermes claw migrate automatisch mehr als 30 Zustandskategorien.⁵
Die Servicequalität hängt von Ihrem Hilfsmodell ab. Vision, Web-Zusammenfassung, Compression und Memory Flush verwenden alle ein separates Hilfs-LLM. Standardmäßig ist das Gemini Flash über Auto-Erkennung (OpenRouter → Nous → Codex) — wenn keiner davon konfiguriert ist, verschlechtern sich diese Funktionen stillschweigend, bis Sie die Hilfs-Slots auf Ihren Hauptprovider verweisen lassen.⁴

Was v0.14 ändert

v0.14.0 dreht sich weniger um eine einzelne Hauptfunktion als darum, den Setup-Aufwand zu reduzieren und zugleich zu erweitern, wo Hermes laufen kann.¹⁹ Die wichtigsten betrieblichen Änderungen:

Installation und Start sind leichter. pip install hermes-agent funktioniert über PyPI, schwere Adapter werden bei der ersten Nutzung lazy installiert, und der Startpfad verzögert genug Arbeit, um den Kaltstart um etwa 19 Sekunden zu verkürzen.
Abonnements können zu lokalen API-Endpoints werden. hermes proxy verwandelt OAuth-gestützte Provider wie Claude Pro, ChatGPT Pro und SuperGrok in einen OpenAI-kompatiblen lokalen Endpoint für Tools wie Codex, Aider, Cline und Continue.
Die gateway-Reichweite wächst. LINE und SimpleX Chat erhöhen die Plattformanzahl auf 22, Microsoft Teams ist durchgängig angebunden, Discord-Verlaufs-Backfill ist standardmäßig aktiviert, und Telegram/Discord-clarify-Prompts nutzen nun native Schaltflächen.
Verifikation zur Schreibzeit wird besser. Nach Bearbeitungen kann Hermes pro Turn Zusammenfassungen von Dateimutationen und semantische Language-Server-Diagnosen anzeigen, bevor der nächste Turn beginnt; damit rückt es näher an evidenzgetriebene Agent-Arbeit heran.
Desktop- und Medien-Tools werden breiter. computer_use funktioniert über cua-driver für Nicht-Anthropic-Provider, video_generate ist einheitlich hinter austauschbaren Backends gebündelt, und vision_analyze sendet rohe Pixel an Modelle, die tatsächlich sehen können.

Jeder folgende Abschnitt stützt sich auf die Upstream-Dokumentation unter hermes-agent.nousresearch.com/docs und den Source Tree unter github.com/NousResearch/hermes-agent. Jede Tatsachenbehauptung hat eine Fußnote, die auf die konkrete Upstream-Seite verweist, von der sie stammt.

Wählen Sie Ihren Weg

Was Sie brauchen	Hier entlang
Hermes installieren	Installation — Einzeilen-Installer oder manuelle Schritte
Bei einem Provider anmelden	Authentifizierung & Provider — der Abschnitt, wegen dem Sie hier sind
Modelle mitten in der Sitzung wechseln	Der Befehl `hermes auth` und Benutzerdefinierte & selbst gehostete Endpoints für die `/model`-Syntax
Ein lokales LLM ausführen	Benutzerdefinierte & selbst gehostete Endpoints — Ollama, vLLM, SGLang, llama.cpp, LM Studio
Messaging-Plattformen verbinden	Messaging Gateway — Telegram, Discord, Slack, WhatsApp, Signal, Google Chat, LINE, SimpleX Chat (insgesamt 22)
Einen skill schreiben oder installieren	skills-System — progressive Disclosure + skill hub
Tiefgehende Referenz für jeden CLI-Befehl	Lesen Sie weiter — und verlinken Sie direkt auf CLI-Befehle

Wie Hermes funktioniert: Das Mental Model

Hermes ist um eine einzelne Konversationsschleife herum aufgebaut, die jeder Einstiegspunkt aufrufen kann. Die Einstiegspunkte sind die CLI (cli.py), das Messaging-gateway (gateway/run.py), der ACP-Adapter für die Editor-Integration, der Batch-Runner und ein API-Server.³ Alle rufen letztlich AIAgent.run_conversation() in run_agent.py auf, das:

den System-Prompt aus SOUL.md, MEMORY.md, USER.md, skills, Kontextdateien und Tool-Anweisungen über prompt_builder.py erstellt³
den Runtime-Provider über runtime_provider.py auflöst — in diesem Schritt werden Ihre Authentifizierung, die Base-URL und der API-Modus ausgewählt³
den Provider mit einem von drei API-Modi aufruft: chat_completions, codex_responses oder anthropic_messages³
alle zurückgegebenen Tool-Aufrufe über model_tools.py und die zentrale Tool-Registry (tools/registry.py) weiterleitet³
die Schleife fortsetzt, bis das Modell eine finale Antwort erzeugt, und die Sitzung anschließend mit FTS5 in SQLite speichert³

Diese Schleife zu verstehen ist wichtig, weil jede Funktion — Persönlichkeiten, Memory, skills, Komprimierung, Fallback — an einer dieser Stufen ansetzt. Wenn Sie einen Konfigurationsschlüssel lesen und sich fragen, was er bewirkt, lautet die Antwort meist: „Er ist ein Regler für Stufe 1, 2, 3 oder 4 der obigen Schleife.“

Plattformunabhängiger Kern. Eine einzige AIAgent-Klasse bedient CLI, gateway, ACP, Batch und API-Server. Plattformunterschiede liegen im Einstiegspunkt, nicht im Agenten selbst.³ Deshalb funktionieren dieselben Slash Commands im Terminal und in Telegram — sie werden aus einer gemeinsamen COMMAND_REGISTRY in hermes_cli/commands.py heraus verarbeitet.⁶

Die Verzeichnisstruktur ist das System. Hermes speichert alles unter ~/.hermes/ (oder $HERMES_HOME für Profile außerhalb der Standardeinstellung):⁴

~/.hermes/
├── config.yaml        # Settings (model, terminal, TTS, compression, etc.)
├── .env               # API keys and secrets
├── auth.json          # OAuth provider credentials (Nous Portal, Codex, Anthropic)
├── SOUL.md            # Primary agent identity (slot #1 in system prompt)
├── memories/          # Persistent memory (MEMORY.md, USER.md)
├── skills/            # Bundled + agent-created + hub-installed skills
├── cron/              # Scheduled jobs
├── sessions/          # Gateway session state
└── logs/              # agent.log, gateway.log, errors.log (secrets auto-redacted)

Jede oben genannte Datei hat eine bestimmte Rolle; keine davon überschneidet sich. Wenn Sie nach „Wo speichert Hermes X?“ suchen, ist es eine dieser Dateien.

Was ist neu in v0.18.0 (The Judgment Release)

Hermes Agent v0.18.0 (Tag v2026.7.1, 1. Juli 2026) ist nach Urteilsvermögen benannt: Der Agent überprüft seine eigene Arbeit, statt Erfolg nur zu behaupten, und bietet Ensemble-Reasoning, das Sie tatsächlich prüfen können. Außerdem schließt diese Version den gesamten P0/P1-Backlog — rund 692 Einträge mit höchster Priorität wurden in zwölf Tagen erledigt.²²

Mixture-of-Agents als First-Class-Modell. MoA ist nun über alle Oberflächen hinweg wie jedes andere Modell auswählbar, und Ensemble-Reasoning ist sichtbar: Die vollständige Ausgabe jedes Referenzmodells wird als eigener beschrifteter Block mit Live-Antwortstreaming dargestellt — Sie können dem Ensemble beim Denken zusehen, statt eine undurchsichtige zusammengeführte Antwort zu erhalten.²²
Completion Contracts für /goal. Der Agent überprüft seine eigene Arbeit, indem er die Projektchecks ausführt, bevor er ein Ziel als abgeschlossen meldet, statt Erfolg nur zu behaupten — Urteilsvermögen auf sich selbst angewandt.²²
/learn — alles in eine skill beschreiben. Verwandeln Sie einen Workflow in eine wiederverwendbare skill, indem Sie ihn beschreiben; generierte skills erfüllen automatisch die CONTRIBUTING.md-Konventionen des Repos.²²
/journey-Zeitleiste. Eine visuelle Historie von Memory und skills im Zeitverlauf, inklusive Bearbeitung, sowie ein Memory-Graph auf dem Desktop.²²
Background-Subagent-Fan-out. Delegieren Sie mehrere Aufgaben, die gleichzeitig laufen, ohne die Konversation zu blockieren — aus dem einzelnen Background-Subagent von v0.17.0 wird eine ganze Flotte.²²
Desktop Projects. First-Class-Coding-Projects mit einem Organisationsmodell aus Projekt, Repo und Lane.²²
Scale-to-zero-gateway. Gateways können bei Inaktivität in den Ruhezustand wechseln und Drains für nahtlose Deployments koordinieren — relevant für alle, die Hermes als dauerhaft laufenden Dienst betreiben.²²
Google Vertex AI-Unterstützung. Gemini-Zugriff über GCP-Service-Accounts mit automatischer OAuth2-Token-Aktualisierung, nun Teil des Provider-Katalogs.²²
/prompt-Editorbefehl. Öffnet $EDITOR, um mehrzeilige Prompts zu verfassen, statt sich mit der Eingabezeile abzumühen.²²

Wenn Sie von v0.17.x aktualisieren, bricht hier nichts die CLI. Die wichtigsten Gründe für ein Upgrade sind Completion Contracts (Ziele, die sich selbst überprüfen), First-Class-MoA mit prüfbaren Ensembles und /learn zur Erfassung von skills.

Was ist neu in v0.17.0 (The Reach Release)

Hermes Agent v0.17.0 (Tag v2026.6.19, 19. Juni 2026) ist danach benannt, wie weit der Agent nun reicht — neue Messaging-Kanäle, neue Modellanbieter sowie tiefere Desktop- und Dashboard-Steuerung. Die Version ergänzt v0.16.x; die CLI-Oberfläche bleibt unverändert.²¹

Neue Messaging-Kanäle. iMessage funktioniert jetzt ohne Mac-Relay über Photon Spectrum (Device-Code-OAuth, hermes photon login); die WhatsApp Business Cloud API ist ein offizieller Meta-Adapter, der die Bridge-Prozess-Anforderung ersetzt; SimpleX erhält Gruppen, native Anhänge, Text-Batching und Auto-Accept; und Raft kommt als gebündeltes Plattform-Plugin mit einem Wake-Channel-Design nach Privacy-by-Contract hinzu.²¹
Neue Modelle und Provider. Der Katalog ergänzt z-ai/glm-5.2 (1M Kontext), anthropic/claude-fable-5, laguna-m.1, nemotron-3-ultra und grok-composer-2.5-fast (Cursors Modell über xAI OAuth, 200k Kontext). Der xAI-Standard wurde auf grok-build-0.1 umgestellt, und adaptive Anthropic-Modelle folgen jetzt dem modernen Thinking Contract (sie senden nie ein reasoning-Feld).²¹
Desktop und Dashboard. Desktop ergänzt Background-Subagents mit Live-„Watch-Windows“, die delegierte Aktivität streamen (delegate_task(background=true)), einen Composer-Modellselektor, neu belegbare Tastenkürzel, native OS-Benachrichtigungen, Composer-Entwürfe pro Thread, VS Code Marketplace-Themes sowie japanische und traditionell chinesische UI. Das Dashboard ergänzt einen vollständigen Profile Builder (Modell/skills/MCPs ohne Bearbeitung von config.yaml), einen globalen Profilumschalter, einen überarbeiteten Skills Hub mit Security Scan, Automation Blueprints (parametrisierte Vorlagen für Formular, Slash Command, Konversation und Dokumentation) sowie ein sicheres Login, das hinter dem OAuth-Gate 401 zurückgibt.²¹
Skills und Tools. image_generate kann jetzt ein Quellbild bearbeiten und transformieren, statt nur neue Bilder von Grund auf zu erstellen, und zwar über alle unterstützten Bildprovider hinweg; das memory-Tool erhielt ein operations-Array für atomare Batch-Vorgänge zum Hinzufügen/Ersetzen/Entfernen in einem einzigen Aufruf; eine neue simplify-code-skill führt einen parallelen Review-und-Cleanup-Durchlauf mit drei Agenten aus, gesteuert durch eine Chesterton’s-Fence-Risikostufe; und ein boolesches write_approval ersetzt das dreistufige write_mode.²¹
Architektur. Background-Subagents geben sofort ein Handle zurück und bringen ihr Ergebnis als neuen Turn wieder ein; ein MCP-Elicitation-Handler erlaubt Bestätigung mitten im Tool-Aufruf, und spät verbundene MCP-Tools werden zwischen Turns verfügbar gemacht (cache-sicher); cron wird zu einem steckbaren CronScheduler mit Chronos-Managed-cron-Provider; und ein neuer Managed scope (/etc/hermes) erlaubt Administratoren, für Benutzer unveränderliche Konfiguration festzulegen, ergänzt durch ein Gateway-Gateway-Relay für Multi-Gateway-Topologien.²¹
Neue Befehle. /version, /billing (interaktives Terminal-Billing), hermes photon login (iMessage-Auth) und hermes curator run --consolidate — Konsolidierung ist jetzt opt-in, sodass routinemäßige Hintergrundkuratierung null Tokens kostet.²¹
Sicherheit. v0.17.0 schließt einen Shell-Escape-Denylist-Bypass, schlägt bei fehlenden Approval-Modulen und Own-Policy-gateway-Adaptern geschlossen fehl, bereinigt die Umgebung für Cron-Job-Script-Subprozesse, schwärzt Secrets in Request-Debug-Dumps, prüft MCP-stdio-Konfigurationen auf Exfil-Muster und hebt urllib3 sowie PyJWT an, um CVEs zu beheben.²¹

Wenn Sie von v0.16.x aktualisieren, bricht hier nichts die CLI; es sind neue Kanäle, Modelle und Oberflächen rund um denselben Agenten. Relay-freies iMessage, die offiziellen WhatsApp-Adapter und der Administrator-Managed scope sind die wichtigsten Gründe für ein Upgrade.

Was ist neu in v0.16.0 (The Surface Release)

Hermes Agent v0.16.0 (Tag v2026.6.5, 5. Juni 2026) ist nach den neuen Oberflächen benannt, die vor den CLI-first Agent gesetzt werden. Die wichtigste Neuerung: Hermes ist nicht mehr nur im Terminal nutzbar.²⁰

Native Desktop-App. Hermes Desktop ist eine neue Electron-App für macOS, Linux und Windows mit Ein-Klick-Installation und Selbstaktualisierung in der App. Sie bietet Ihnen ein Streaming-Chatfenster, Drag-and-drop-Dateien, Einfügen von Bildern aus der Zwischenablage, eine Cmd+K-Palette, eine Sitzungsliste mit Archiv und Suche sowie eine Modellauswahl in der Statusleiste. Sie kann über ein sicheres WebSocket eine Verbindung zu einem entfernten Hermes gateway herstellen, mit Authentifizierung per OAuth oder Benutzername/Passwort, mit entfernten Hosts pro profile und gleichzeitigen Multi-profile-Sitzungen, die über profilübergreifende @session-Verweise verbunden sind. Die Desktop-UI wird außerdem mit einer vollständigen Übersetzung ins vereinfachte Chinesisch (简体中文) über eine typisierte i18n-Schicht ausgeliefert (display.language; Englisch bleibt die Standardeinstellung).²⁰
Browser-Administrationspanel. Das lokale Web-Dashboard ist von einer Statusansicht zu einem vollständigen Administrationspanel geworden: ein MCP-Katalog mit Aktivieren/Deaktivieren-Schaltern, Zugangsdatenverwaltung, Webhook- und Hook-Erstellung, Speicherkonfiguration, gateway-Steuerung und einer Systemseite mit Prüfung vor Aktualisierung plus Ein-Klick-Debug-Share. Eine neue Channels-Seite konfiguriert jede gateway-Messaging-Plattform (Telegram, Discord, Slack und die übrigen) im Browser. Auth ist jetzt austauschbar: Login mit Benutzername/Passwort, ein generischer selbst gehosteter OIDC-Anbieter, hermes dashboard register für einen selbst gehosteten OAuth-Client und Refresh-Token-Sitzungsrotation.²⁰
Neue CLI- und Slash-Befehle. /undo [N] sichert die letzten N Benutzer-Turns mit Prefill und Soft-Delete und funktioniert in CLI, TUI und über Messaging-Plattformen hinweg. Eine konfigurierbare Standardschnittstelle (cli vs. tui) kommt mit einer --cli-Überschreibung; die TUI erhält einen einheitlichen /model-Befehl und ein Sessions-Overlay. hermes portal ist ein menschenlesbarer Alias für den Nous Portal-Onboarding-Flow, mit neuen Erststartpfaden Quick Setup vs. Full Setup, und zwei Diagnosebefehle kommen hinzu: hermes prompt-size und hermes sessions optimize.²⁰
Neue Modelle und Anbieter. Die Auswahl ergänzt deepseek-v4-flash, MiniMax-M3 (1M Kontext, native MiniMax-Anbieter), qwen3.7-plus (Nous + OpenRouter) und gemini-3.5-flash (Gemini OAuth + API-Schlüssel). Ein erstklassiger xAI Grok OAuth-Anbieter kommt zum Desktop-Launcher hinzu, die Modellauswahl wurde auf jeder Oberfläche unscharf durchsuchbar, Anbieter mit mehreren Endpunkten werden in einer Zeile gruppiert, und die Katalogaktualisierung wurde von täglich auf stündlich umgestellt.²⁰
Schlankere skills und progressive Offenlegung. Der Standard-skill-Satz hat redundante und tote skills entfernt (Spotify wurde in ein natives Plugin verschoben, Linear zu hermes mcp install linear, und mehrere veraltete Einträge wurden entfernt), mehr in optionale Bereiche verschoben und ein environments:-Frontmatter-Relevanzgate (kanban/docker/s6) ergänzt, das kontextspezifische skills aus dem Index heraushält, bis sie angefordert werden. NVIDIA/skills ist jetzt neben OpenAI, Anthropic und HuggingFace ein standardmäßig vertrauenswürdiger Skills Hub-Tap. MCP- und Plugin-Tools haben eine progressive (bereichsbezogene) Tool-Offenlegung erhalten, und ein MCP-Fehler, der fälschlich OAuth-Erfolg meldete, obwohl kein Token erhalten wurde, ist behoben.²⁰
Sicherheit. v0.16.0 pinnt gepatchtes Starlette (≥1.0.1) für CVE-2026-48710 (BadHost), verlagert SSRF-URL-Prüfungen in asynchronen Pfaden aus dem Event-Loop, entfernt das Bedrock-Inference-Bearer-Token aus der Subprozess-Umgebung, nimmt bws_cache.json in den Dateisicherheits-Leseschutz auf, ergänzt docker restart/stop/kill in der Liste gefährlicher Muster und bereinigt unsichtbares Unicode in geprüften skill-Inhalten. Das Release schloss 2 P0- und 62 P1-Probleme, davon 16 mit Sicherheits-Tag.²⁰

Wenn Sie von v0.15.x aktualisieren, ist nichts davon eine Breaking Change am CLI selbst; es sind zusätzliche Oberflächen und Anbieter rund um denselben Agent. Die Desktop-App und das Administrationspanel sind der Grund für das Upgrade, wenn Sie Hermes für Benutzer ohne Terminal betreiben oder ein entferntes gateway über einen Browser administrieren möchten.

Installation

Der Einzeilen-Installer bleibt für die meisten Benutzer der geführte Weg. Er übernimmt Python, uv, Node.js, ripgrep, ffmpeg, den Repo-Klon, die virtuelle Umgebung und den globalen Befehl hermes.⁷ v0.14.0 liefert außerdem ein echtes PyPI-Paket aus, sodass pip install hermes-agent jetzt eine praktikable Direktinstallation ist, wenn Sie die Python-Umgebung bereits kontrollieren.¹⁹

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

pip install hermes-agent
hermes

Funktioniert unter Linux, macOS, WSL2 und Android/Termux (der Installer erkennt Termux automatisch und wechselt zu einem getesteten Android-Bundle).⁷ v0.14.0 fügt native Windows-Unterstützung in einer frühen Beta über einen PowerShell-Installer hinzu, WSL2 bleibt jedoch die sicherere Empfehlung für den Produktionseinsatz, bis der Windows-Pfad ausgereifter ist.¹⁹

Nach Abschluss:

source ~/.bashrc    # or ~/.zshrc
hermes              # Start chatting

Die einzige Voraussetzung ist git. Der Installer stellt Python 3.11 automatisch über uv bereit (kein sudo erforderlich), außerdem Node.js v22 (für Browser-Automatisierung und die WhatsApp-Bridge), ripgrep und ffmpeg.⁷

Installation überprüfen

hermes version      # Check version
hermes doctor       # Diagnose config/dependency issues
hermes status       # Show current configuration + auth state
hermes dump         # Copy-pasteable setup summary for debugging

hermes doctor zeigt Ihnen genau, was fehlt und wie Sie es beheben.⁷ hermes dump ist der Diagnosebefehl, den Sie in ein GitHub-Issue oder einen Discord-Thread einfügen, wenn Sie Hilfe anfordern — eine Klartextzusammenfassung Ihrer gesamten Einrichtung, bei der Secrets geschwärzt sind.⁸

Manuelle Installation

Wenn Sie volle Kontrolle benötigen — eigene Python-Version, bestimmte Extras, Nix/NixOS-Integration — ist der manuelle Ablauf Schritt für Schritt im Upstream-Installationsleitfaden dokumentiert.⁷ Wichtige optionale Extras, die Sie mit uv pip install -e ".[<extras>]" kombinieren können:

Extra	Was es hinzufügt
`all`	Alles unten Genannte
`messaging`	Telegram- und Discord-gateway
`cron`	Parsing von cron-Ausdrücken
`cli`	Terminal-Menü-UI für den Einrichtungsassistenten
`modal`	Modal-Cloud-Ausführungsbackend
`voice`	CLI-Mikrofoneingabe + Audiowiedergabe
`tts-premium`	ElevenLabs-Premiumstimmen
`honcho`	AI-nativer Speicher (Honcho-Integration)
`mcp`	Unterstützung für Model Context Protocol
`homeassistant`	Home Assistant-Integration
`acp`	Unterstützung für ACP-Editorintegration
`slack`	Slack-Messaging
`pty`	PTY-Terminalunterstützung (interaktive CLI-Tools)
`dev`	pytest- und Testdienstprogramme
`termux`	Getestetes Android-Bundle (enthält `cron`, `cli`, `pty`, `mcp`, `honcho`, `acp`)

Der Termux-Installationsbefehl ist anders — er verwendet pip mit einer Constraints-Datei, nicht uv pip:

python -m pip install -e ".[termux]" -c constraints-termux.txt

Das liegt daran, dass .[all] auf Android über das voice-Extra faster-whisper einbindet, das von ctranslate2-Wheels abhängt, die für Android nicht veröffentlicht werden.⁷

Authentifizierung & Provider

Hermes unterstützt etwa 19 erstklassige Provider plus benutzerdefinierte Endpunkte und 3 unterschiedliche Authentifizierungspfade. Hier ist die gesamte Authentifizierungsoberfläche, nach Pfad geordnet, damit Sie den passenden Weg für Ihre vorhandene Einrichtung finden.

Die 3 Authentifizierungspfade

Jeder Provider in Hermes passt in eines von 3 Authentifizierungsmustern:

Pfad 1 — API key in .env. Legen Sie Ihren Key in ~/.hermes/.env ab, und Hermes liest ihn beim Start. Wird von OpenRouter, AI Gateway, z.ai/GLM, Kimi/Moonshot, MiniMax (und MiniMax China), Alibaba Cloud/DashScope, Kilo Code, OpenCode Zen, OpenCode Go, DeepSeek, Hugging Face, Google/Gemini und den meisten Drittanbieter-Providern verwendet.²

Pfad 2 — OAuth über hermes model oder hermes auth. Startet einen Device-Code-Flow, öffnet einen Browser, speichert Anmeldedaten in ~/.hermes/auth.json und kann vorhandene Anmeldedaten aus Tools wie Claude Code oder Codex CLI importieren. Wird von Nous Portal, OpenAI Codex (ChatGPT-Konto), GitHub Copilot und Anthropic (Claude Pro/Max) verwendet.²

Pfad 3 — Benutzerdefinierter Endpunkt in config.yaml. Für jede OpenAI-kompatible API — Ollama, vLLM, SGLang, llama.cpp, LM Studio, LiteLLM proxy, Together AI, Groq, Azure OpenAI oder Ihren eigenen selbst gehosteten Server. Einmal über hermes model → Custom endpoint konfiguriert und anschließend in config.yaml gespeichert.²

Die vollständige Provider-Matrix

Dies ist die vollständige Liste der erstklassigen Provider, jeweils mit dem genauen Einrichtungsablauf.²

Provider	Authentifizierungspfad	Einrichtung
Nous Portal	OAuth	`hermes model` (OAuth-Login, abonnementbasiert)
OpenAI Codex	OAuth	`hermes model` (ChatGPT-Device-Code, verwendet Codex-Modelle)
GitHub Copilot	OAuth oder Token	`hermes model` (OAuth-Device-Code) oder `COPILOT_GITHUB_TOKEN` / `GH_TOKEN` / `gh auth token`
GitHub Copilot ACP	Lokaler Subprozess	`hermes model` (erfordert `copilot` CLI in PATH + `copilot login`)
Anthropic	OAuth oder API key	`hermes model` (bevorzugt Claude Code-Anmeldedaten) oder `ANTHROPIC_API_KEY` oder `ANTHROPIC_TOKEN`-Setup-Token
OpenRouter	API key	`OPENROUTER_API_KEY` in `~/.hermes/.env`
AI Gateway (Vercel)	API key	`AI_GATEWAY_API_KEY` in `~/.hermes/.env` (Provider: `ai-gateway`)
z.ai / GLM (ZhipuAI)	API key	`GLM_API_KEY` in `~/.hermes/.env` (Provider: `zai`)
Kimi / Moonshot	API key	`KIMI_API_KEY` in `~/.hermes/.env` (Provider: `kimi-coding`)
MiniMax (global)	API key	`MINIMAX_API_KEY` in `~/.hermes/.env` (Provider: `minimax`)
MiniMax China	API key	`MINIMAX_CN_API_KEY` in `~/.hermes/.env` (Provider: `minimax-cn`)
Alibaba Cloud (Qwen)	API key	`DASHSCOPE_API_KEY` in `~/.hermes/.env` (Provider: `alibaba`, Aliasse: `dashscope`, `qwen`)
Kilo Code	API key	`KILOCODE_API_KEY` in `~/.hermes/.env` (Provider: `kilocode`)
OpenCode Zen	API key	`OPENCODE_ZEN_API_KEY` in `~/.hermes/.env` (Provider: `opencode-zen`)
OpenCode Go	API key	`OPENCODE_GO_API_KEY` in `~/.hermes/.env` (Provider: `opencode-go`)
DeepSeek	API key	`DEEPSEEK_API_KEY` in `~/.hermes/.env` (Provider: `deepseek`)
Hugging Face	API key	`HF_TOKEN` in `~/.hermes/.env` (Provider: `huggingface`, Alias: `hf`)
Google / Gemini	API key	`GOOGLE_API_KEY` oder `GEMINI_API_KEY` in `~/.hermes/.env` (Provider: `gemini`)
xAI (Grok)	Nativer Provider / SuperGrok OAuth	Erstklassiger Provider mit direktem API-Zugriff und Modellkatalog (v0.9.0+). v0.14.0 fügt SuperGrok OAuth hinzu und erhöht grok-4.3 für berechtigte Konten auf ein Kontextfenster von 1M.²¹⁶¹⁹ v0.17.0 fügt `grok-composer-2.5-fast` hinzu (Cursor-Modell über xAI OAuth, 200k Kontext) und ändert den xAI-Standard auf `grok-build-0.1`.²¹
xAI Custom Voices	API key	TTS-Provider mit Voice Cloning. Neu in v0.13.0; unter `tts:` in `config.yaml` konfigurieren und den xAI-Key in `.env` bereitstellen.¹⁸
Xiaomi MiMo	Nativer Provider	Erstklassiger Provider mit Einrichtungsassistent und Modellkatalog. Kostenloses MiMo v2 Pro auf Nous Portal für Hilfsaufgaben (v0.9.0+).¹⁶¹⁵
Google AI Studio	API key	`GOOGLE_API_KEY` oder `GEMINI_API_KEY` in `~/.hermes/.env`. Direkter Gemini-Zugriff mit automatisch erkannten Kontextlängen über die models.dev-Registry (v0.8.0+).¹⁵
Qwen Cloud	OAuth	OAuth-Provider mit Portal-Request-Unterstützung (v0.8.0+). Der Provider wurde in v0.14.0 von Alibaba Cloud in Qwen Cloud umbenannt; vorhandene Konfigurationskeys funktionieren weiter.¹⁵¹⁹
Custom endpoint	config.yaml	`hermes model` → “Custom endpoint” (in `config.yaml` gespeichert)

Anthropic: 3 Authentifizierungsmethoden

Anthropic bekommt einen eigenen Abschnitt, weil Hermes 3 unterschiedliche Wege zu Claude unterstützt und die richtige Wahl wichtig ist. Aus den Upstream-Dokumenten:²

# Method 1: API key (pay-per-token)
export ANTHROPIC_API_KEY=***
hermes chat --provider anthropic --model claude-sonnet-4-6

# Method 2: OAuth through hermes model (preferred)
# Uses Claude Code's credential store when available
hermes model

# Method 3: Manual setup-token (fallback/legacy)
export ANTHROPIC_TOKEN=***
hermes chat --provider anthropic

# Auto-detect Claude Code credentials
hermes chat --provider anthropic   # reads Claude Code files automatically

Wenn Sie Anthropic OAuth über hermes model wählen, bevorzugt Hermes den eigenen Anmeldedatenspeicher von Claude Code, statt den Token nach ~/.hermes/.env zu kopieren. So bleiben aktualisierbare Claude-Anmeldedaten aktualisierbar.² Wenn Sie Claude Code bereits auf derselben Maschine verwenden, ist dies der sauberste Weg.

Um Anthropic dauerhaft in config.yaml festzulegen:

model:
  provider: "anthropic"
  default: "claude-sonnet-4-6"

--provider claude und --provider claude-code funktionieren ebenfalls als Kurzformen für --provider anthropic.²

GitHub Copilot: 2 Modi

Copilot wird in 2 Modi unterstützt: direktes Copilot API (empfohlen) und Copilot ACP, das das lokale Copilot CLI als Subprozess startet.²

# Direct Copilot API
hermes chat --provider copilot --model gpt-5.4

# Copilot ACP (requires the Copilot CLI in PATH + an existing copilot login)
hermes chat --provider copilot-acp --model copilot-acp

Die Authentifizierung wird laut Upstream-Dokumenten in dieser Reihenfolge geprüft:² 1. COPILOT_GITHUB_TOKEN-Umgebungsvariable 2. GH_TOKEN-Umgebungsvariable 3. GITHUB_TOKEN-Umgebungsvariable 4. gh auth token CLI-Fallback 5. OAuth-Device-Code-Login über hermes model

Der Tokentyp ist wichtig. Das Copilot API unterstützt keine klassischen Personal Access Tokens (ghp_*). Unterstützte Typen sind OAuth-Tokens (gho_*), fine-grained PATs (github_pat_* mit Copilot Requests-Berechtigung) und GitHub App-Tokens (ghu_*). Wenn Ihr gh auth token einen ghp_*-Token zurückgibt, verwenden Sie stattdessen hermes model, um sich per OAuth zu authentifizieren.²

Chinesische AI-Provider (erstklassige Unterstützung)

Hermes hat integrierte Unterstützung für z.ai/GLM, Kimi/Moonshot, MiniMax (globale + China-Endpunkte) und Alibaba Cloud mit dedizierten Provider-IDs.²

# z.ai / ZhipuAI GLM
hermes chat --provider zai --model glm-5                 # Requires: GLM_API_KEY

# Kimi / Moonshot AI
hermes chat --provider kimi-coding --model kimi-for-coding   # Requires: KIMI_API_KEY

# MiniMax (global)
hermes chat --provider minimax --model MiniMax-M2.7          # Requires: MINIMAX_API_KEY

# MiniMax (China)
hermes chat --provider minimax-cn --model MiniMax-M2.7       # Requires: MINIMAX_CN_API_KEY

# Alibaba Cloud / DashScope (Qwen)
hermes chat --provider alibaba --model qwen3.5-plus          # Requires: DASHSCOPE_API_KEY

Basis-URLs können mit den Umgebungsvariablen GLM_BASE_URL, KIMI_BASE_URL, MINIMAX_BASE_URL, MINIMAX_CN_BASE_URL oder DASHSCOPE_BASE_URL überschrieben werden.²

Z.AI erkennt den Endpunkt automatisch. Beim z.ai/GLM-Provider prüft Hermes mehrere Endpunkte (global, China, Coding-Varianten), um einen zu finden, der Ihren API key akzeptiert. Der funktionierende Endpunkt wird automatisch zwischengespeichert — für die meisten Benutzer ist kein GLM_BASE_URL nötig.²

xAI (Grok) aktiviert Prompt-Caching automatisch. Wenn die Basis-URL x.ai enthält, sendet Hermes bei jeder Anfrage den Header x-grok-conv-id, um innerhalb einer Unterhaltungssitzung zum selben Server zu routen und zwischengespeicherte System-Prompts sowie den Verlauf wiederzuverwenden.² Automatisch; keine Konfiguration nötig.

Der Befehl `hermes auth`

hermes auth ist der Befehl zur Anmeldedatenverwaltung für Pools und OAuth-Anmeldedaten.⁶

hermes auth                              # Interactive wizard
hermes auth list                         # Show all credential pools
hermes auth list openrouter              # Show one provider's pool
hermes auth add openrouter --api-key sk-or-v1-xxx
hermes auth add anthropic --type oauth
hermes auth remove openrouter 2          # Remove by index
hermes auth reset openrouter             # Clear cooldowns

Mit Anmeldedatenpools rotieren Sie mehrere API keys oder OAuth-Tokens für denselben Provider — nützlich, um Ratelimits auf mehrere Keys zu verteilen, ohne Code zu ändern.⁶ Die alten Befehle hermes login / hermes logout wurden entfernt; verwenden Sie stattdessen hermes auth.⁶

Benutzerdefinierte & selbst gehostete Endpunkte

Hermes funktioniert mit jedem OpenAI-kompatiblen API-Endpunkt. Wenn ein Server /v1/chat/completions implementiert, können Sie Hermes darauf ausrichten.²

Interaktive Einrichtung (empfohlen):

hermes model
# Select "Custom endpoint (self-hosted / VLLM / etc.)"
# Enter: API base URL, API key, Model name

Manuelles config.yaml:

model:
  default: your-model-name
  provider: custom
  base_url: http://localhost:8000/v1
  api_key: your-key-or-leave-empty-for-local

Beide Ansätze speichern in config.yaml, der einzigen maßgeblichen Quelle für Hauptmodell, Provider und Basis-URL.² Die alten Env Vars OPENAI_BASE_URL und LLM_MODEL werden für die Hauptmodellkonfiguration nicht mehr gelesen — verwenden Sie hermes model oder bearbeiten Sie config.yaml direkt.² (OPENAI_BASE_URL + OPENAI_API_KEY werden weiterhin als Fallback für den Hilfs-Routingpfad provider: "main" berücksichtigt; löschen Sie sie also nicht blind, falls Sie sie dort verwenden.)⁴

Benutzerdefinierte Endpunkte mitten in der Sitzung wechseln:

/model custom:qwen-2.5             # Custom endpoint with explicit model
/model custom                      # Auto-detect the model from the endpoint
/model custom:local:qwen-2.5       # Named custom provider "local"
/model custom:work:llama3          # Named custom provider "work"
/model openrouter:claude-sonnet-4  # Back to a cloud provider

/model custom (pur, ohne Modellname) fragt die /v1/models API Ihres Endpunkts ab und wählt das Modell automatisch aus, wenn genau eines geladen ist — nützlich für lokale Server, auf denen ein einzelnes Modell läuft.²

Lokale LLM-Server (Einrichtungsvorlagen)

Die Upstream-Dokumente enthalten vollständige Einrichtungsguides für Ollama, vLLM, SGLang, llama.cpp und LM Studio. Hier sind die wichtigsten Befehle, die Sie tatsächlich ausführen werden. Jeder davon ist dafür ausgelegt, einen funktionierenden Endpunkt bereitzustellen, auf den Hermes zeigen kann.²

Ollama — einfachster lokaler Weg, ohne Konfiguration:

ollama pull qwen2.5-coder:32b
OLLAMA_CONTEXT_LENGTH=32768 ollama serve   # Raise from 4k default
hermes model   # Custom endpoint → http://localhost:11434/v1 → qwen2.5-coder:32b

Kritischer Ollama-Fallstrick: Ollama verwendet standardmäßig sehr niedrige Kontextlängen (4.096 Token unter 24 GB VRAM). Sie müssen diese über OLLAMA_CONTEXT_LENGTH oder eine Modelfile erhöhen — die OpenAI-kompatible API akzeptiert keine Kontextlänge vom Client, daher kann Hermes sie nicht für Sie setzen.² Für Agent-Einsatz sollten Sie mindestens 16k–32k einstellen.

vLLM — hochperformantes GPU-Serving:

pip install vllm
vllm serve meta-llama/Llama-3.1-70B-Instruct \
  --port 8000 \
  --max-model-len 65536 \
  --tensor-parallel-size 2 \
  --enable-auto-tool-choice \
  --tool-call-parser hermes

Tool Calling erfordert --enable-auto-tool-choice und --tool-call-parser <name>. Unterstützte Parser: hermes (Qwen 2.5, Hermes 2/3), llama3_json, mistral, deepseek_v3, deepseek_v31, xlam, pythonic. Ohne diese Flags kommen Tool Calls als reiner Text zurück.²

SGLang — schnelles Serving mit RadixAttention zur Wiederverwendung des KV-Caches:

pip install "sglang[all]"
python -m sglang.launch_server \
  --model meta-llama/Llama-3.1-70B-Instruct \
  --port 30000 \
  --context-length 65536 \
  --tp 2 \
  --tool-call-parser qwen

SGLang-Fallstrick: Der Standardwert für max_tokens ist 128. Setzen Sie --default-max-tokens auf dem Server oder konfigurieren Sie model.max_tokens in config.yaml, wenn Antworten abgeschnitten werden.²

llama.cpp / llama-server — CPU und Apple Silicon Metal:

./build/bin/llama-server \
  --jinja -fa \
  -c 32768 \
  -ngl 99 \
  -m models/qwen2.5-coder-32b-instruct-Q4_K_M.gguf \
  --port 8080 --host 0.0.0.0

--jinja ist für Tool Calling erforderlich. Ohne diese Option ignoriert llama-server den Parameter tools vollständig, und das Modell versucht, Tools aufzurufen, indem es JSON in seinen Antworttext schreibt — was Hermes nicht als echte Tool Calls parsen kann.²

LM Studio — Desktop-App mit GUI:

Starten Sie den Server aus der LM Studio-App (Developer-Tab → Start Server) oder über CLI: lms server start (startet auf Port 1234) und lms load qwen2.5-coder --context-length 32768.² Richten Sie hermes model anschließend auf http://localhost:1234/v1.

Kritischer LM Studio-Fallstrick: LM Studio liest die Kontextlänge aus den Modellmetadaten, aber viele GGUF-Modelle melden Standardwerte von 2048 oder 4096. Setzen Sie die Kontextlänge in den LM Studio-Modelleinstellungen immer explizit — klicken Sie auf das Zahnradsymbol neben der Modellauswahl, setzen Sie “Context Length” auf mindestens 16384 (vorzugsweise 32768) und laden Sie das Modell neu.²

Benannte benutzerdefinierte Provider

Wenn Sie mit mehreren benutzerdefinierten Endpunkten arbeiten, etwa einem lokalen Entwicklungsserver und einem entfernten GPU-Server, definieren Sie sie als benannte benutzerdefinierte Provider in config.yaml:²

custom_providers:
  - name: local
    base_url: http://localhost:8080/v1
    # api_key omitted — Hermes uses "no-key-required" for keyless local servers
  - name: work
    base_url: https://gpu-server.internal.corp/v1
    api_key: corp-api-key
    api_mode: chat_completions      # optional, auto-detected from URL
  - name: anthropic-proxy
    base_url: https://proxy.example.com/anthropic
    api_key: proxy-key
    api_mode: anthropic_messages    # for Anthropic-compatible proxies

Dann wechseln Sie mitten in der Sitzung mit der dreiteiligen Syntax zwischen ihnen:

/model custom:local:qwen-2.5
/model custom:work:llama3-70b
/model custom:anthropic-proxy:claude-sonnet-4

Sie können benannte benutzerdefinierte Provider auch aus dem interaktiven Menü hermes model auswählen.²

Steckbare Provider-Architektur (v0.13.0+)

v0.13.0 liefert eine ProviderProfile ABC plus ein Verzeichnis plugins/model-providers/, sodass Drittanbieter-Inferenzprovider ohne Änderungen am Core eingebunden werden können.¹⁸ Wenn ein Provider einen OpenAI-, Anthropic- oder Codex-kompatiblen API-Modus spricht, können Sie eine ProviderProfile-Unterklasse implementieren, die Authentifizierungspfad, Basis-URL, Modellkatalog und Caching-Header deklariert; Hermes löst sie über denselben runtime_provider.py-Pfad auf, den die eingebauten Provider verwenden. Das ist die Architekturänderung hinter der Provider-Erweiterung in v0.13.0: Statt Core-Code zu bearbeiten, um einen Provider hinzuzufügen, liefern Sie ein Plugin aus.

OpenAI-kompatibler lokaler Proxy (v0.14.0+)

hermes proxy stellt einen OpenAI-kompatiblen lokalen Endpunkt bereit, der vom OAuth-Provider unterstützt wird, bei dem Hermes bereits angemeldet ist — Claude Pro, ChatGPT Pro, SuperGrok oder ein anderer kompatibler konfigurierter Provider.¹⁹ Das bedeutet: Tools, die eine OpenAI-artige API erwarten, darunter Codex CLI, Aider, Cline, Continue oder benutzerdefinierte Skripte, können Ihre abonnementgestützte Hermes-Authentifizierung wiederverwenden, ohne einen separaten API key zu benötigen. Behandeln Sie den Proxy als lokale Entwickler-Infrastruktur: Binden Sie ihn bewusst, exponieren Sie ihn nicht breit und behalten Sie providerspezifische Bedingungen im Blick.

Kontextlängenerkennung

Laut Upstream-Dokumenten werden 2 Einstellungen ständig verwechselt:²

context_length — das gesamte Kontextfenster (kombiniertes Eingabe- + Ausgabe-Tokenbudget, z. B. 1.000.000 für Claude Opus 4.7 oder 200.000 für Sonnet 4.6). Hermes nutzt dies, um zu entscheiden, wann der Verlauf komprimiert werden soll.
model.max_tokens — die Ausgabeobergrenze (maximale Anzahl an Token, die das Modell in einer einzelnen Antwort erzeugen darf). Unabhängig von der Verlaufslänge.

Setzen Sie context_length, wenn die automatische Erkennung die Fenstergröße falsch erkennt:

model:
  default: "qwen3.5:9b"
  base_url: "http://localhost:8080/v1"
  context_length: 131072      # tokens

Hermes nutzt eine mehrstufige Auflösungskette, um Kontextfenster zu erkennen: Konfigurationsüberschreibung → benutzerdefinierter Provider pro Modell → persistenter Cache → Endpunkt /models → Anthropic /v1/models → OpenRouter API → Nous Portal → models.dev (Community-gepflegte Registry für über 3800 Modelle) → Fallback-Standardwerte (128K).² Das System ist providerbewusst, sodass dasselbe Modell je nach Anbieter unterschiedliche Kontextlimits haben kann (z. B. ist claude-opus-4.6 direkt auf Anthropic 1M, aber auf GitHub Copilot 128K).²

Provider-Rotation & Fallback

Anmeldedatenpools. Wenn Sie mehrere API keys für denselben Provider haben, konfigurieren Sie über hermes auth eine Rotationsstrategie. So verteilen Sie Ratelimits auf mehrere Keys.⁶

Fallback-Modell. Konfigurieren Sie ein Backup-provider:model, zu dem Hermes automatisch wechselt, wenn Ihr primäres Modell ausfällt (Ratelimits, Serverfehler, Authentifizierungsfehler):²

fallback_model:
  provider: openrouter            # required
  model: anthropic/claude-sonnet-4  # required
  # base_url: http://localhost:8000/v1    # optional, for custom endpoints
  # api_key_env: MY_CUSTOM_KEY           # optional, env var name

Der Fallback tauscht Modell und Provider mitten in der Sitzung aus, ohne Ihre Unterhaltung zu verlieren. Er wird höchstens einmal pro Sitzung ausgelöst.² Unterstützte Provider für Fallback: openrouter, nous, openai-codex, copilot, copilot-acp, anthropic, huggingface, zai, kimi-coding, minimax, minimax-cn, deepseek, ai-gateway, opencode-zen, opencode-go, kilocode, alibaba, custom.²

Hilfsmodelle

Hermes nutzt leichtgewichtige “Hilfsmodelle” für Nebenaufgaben: Bildanalyse, Webseitenzusammenfassung, Browser-Screenshot-Analyse, Klassifizierung zur Genehmigung gefährlicher Befehle, Kontextkomprimierung, Zusammenfassung der Sitzungssuche, skill-Abgleich, MCP-Tool-Dispatch und Memory Flush.⁴ Standardmäßig verwenden diese Gemini Flash über automatische Erkennung (OpenRouter → Nous → Codex).

Sie können konfigurieren, welches Modell und welchen Provider jede Hilfsaufgabe verwendet. Jeder Hilfsslot nutzt dieselben 3 Stellschrauben: provider, model, base_url.⁴

auxiliary:
  vision:
    provider: "auto"                # "auto", "openrouter", "nous", "codex", "main", etc.
    model: ""                       # e.g. "openai/gpt-4o", "google/gemini-2.5-flash"
    base_url: ""                    # Custom OpenAI-compatible endpoint
    api_key: ""                     # Falls back to OPENAI_API_KEY
    timeout: 30
    download_timeout: 30
  web_extract:
    provider: "auto"
    model: ""
    timeout: 360
  approval:
    provider: "auto"
    model: ""
    timeout: 30
  compression:
    timeout: 120
  session_search: { provider: "auto", model: "", timeout: 30 }
  skills_hub:    { provider: "auto", model: "", timeout: 30 }
  mcp:           { provider: "auto", model: "", timeout: 30 }
  flush_memories:{ provider: "auto", model: "", timeout: 30 }

Die Provider-Option "main" bedeutet: “Verwende den Provider, den mein Hauptagent verwendet” — gültig nur innerhalb von auxiliary:, compression: und fallback_model:-Konfigurationen. Für Ihre oberste Einstellung model.provider ist sie nicht gültig. Wenn Sie einen benutzerdefinierten OpenAI-kompatiblen Endpunkt als Hauptmodell verwenden, setzen Sie provider: custom in Ihrem Abschnitt model:.⁴

Warum das wichtig ist: Wenn Sie nur Anthropic OAuth konfiguriert haben (kein OpenRouter-Key), werden Vision, Webzusammenfassung und Komprimierung schlechter funktionieren oder fehlschlagen, weil die standardmäßige Hilfs-Fallback-Kette zuerst OpenRouter versucht. Fügen Sie für Hilfsaufgaben einen OPENROUTER_API_KEY hinzu oder konfigurieren Sie jeden Hilfsslot so um, dass Ihr Hauptprovider verwendet wird:

auxiliary:
  vision:
    provider: "main"
  web_extract:
    provider: "main"

Das ist der mit Abstand häufigste Fallstrick vom Typ “meine Funktionen funktionieren stillschweigend nicht” für neue Hermes-Benutzer.

Konfigurationssystem

Hermes verwendet ein mehrschichtiges Konfigurationssystem. Die Rangfolge zu verstehen, ist entscheidend, weil höhere Ebenen niedrigere überschreiben und eine der Ebenen eine globale Provider-Registry ist, die Sie in config.yaml nicht sehen können.

Aufbau der Konfigurationsdateien

Laut Upstream-Dokumentation bestehen diese Dateien zusammen aus einer Hermes-Konfiguration:⁴

~/.hermes/
├── config.yaml       # All settings (model, terminal, TTS, compression, memory, toolsets, ...)
├── .env              # Secrets (API keys, bot tokens, passwords)
├── auth.json         # OAuth provider credentials (Nous Portal, Codex, Anthropic)
├── SOUL.md           # Primary agent identity (slot #1 in system prompt)
├── memories/         # Persistent memory (MEMORY.md, USER.md)
├── skills/           # Bundled + agent-created + hub-installed skills
├── cron/             # Scheduled jobs
├── sessions/         # Gateway session state
└── logs/             # agent.log, gateway.log, errors.log (secrets auto-redacted)

config.yaml vs. .env — wenn beide gesetzt sind, gewinnt config.yaml bei nicht geheimen Einstellungen.⁴ Die Regel lautet: - Secrets (API keys, Bot-Token, Passwörter) → .env - Alles andere (Modell, Terminal-Backend, Komprimierungseinstellungen, Speicherlimits, toolsets) → config.yaml

Secrets können aus config.yaml mit Shell-artiger Interpolation referenziert werden:⁴

auxiliary:
  vision:
    api_key: ${GOOGLE_API_KEY}
    base_url: ${CUSTOM_VISION_URL}
  delegation:
    api_key: ${DELEGATION_KEY}

Konfiguration verwalten

hermes config                # View current configuration
hermes config show           # Same as above
hermes config edit           # Open config.yaml in your editor
hermes config set KEY VAL    # Set a specific value
hermes config path           # Print the config file path
hermes config env-path       # Print the .env file path
hermes config check          # Check for missing options (after updates)
hermes config migrate        # Interactively add missing options

Beispiele:⁴

hermes config set model anthropic/claude-opus-4
hermes config set terminal.backend docker
hermes config set OPENROUTER_API_KEY sk-or-...   # Saves to .env

hermes config check und hermes config migrate sind die Befehle, die Sie nach jedem hermes update ausführen sollten — sie erkennen neu hinzugefügte Konfigurationsoptionen, die Ihre Datei noch nicht enthält.⁶

Konfigurationsrangfolge

Hermes lädt Konfiguration aus mehreren Quellen. Wenn mehrere Quellen denselben Wert setzen, gewinnt die Quelle mit der höheren Priorität:⁴

CLI-Argumente — hermes chat --model anthropic/claude-sonnet-4 (Überschreibung pro Aufruf)
Umgebungsvariablen — werden beim Prozessstart angewendet
config.yaml — die primäre Einstellungsdatei
.env — nur Secrets
Eingebaute Standardwerte — werden angewendet, wenn nichts anderes einen Wert setzt

CLI-Flags haben für diesen einzelnen Aufruf immer Vorrang. config.yaml ist die langfristige Source of Truth.

Lokalisierung (v0.13.0+)

v0.13.0 fügte 7 Locales für CLI- und gateway-Nachrichten hinzu: Chinesisch (vereinfacht), Japanisch, Deutsch, Spanisch, Französisch, Ukrainisch und Türkisch.¹⁸ v0.14.0 lokalisiert alle gateway-Befehle und das Web-Dashboard, ergänzt 8 weitere Locales und erhöht die Gesamtzahl auf 16.¹⁹ Die Dokumentation ist derzeit nur in zh-Hans lokalisiert. Das Locale wird aus den Umgebungsvariablen LC_ALL / LANG oder einem expliziten locale:-Schlüssel in config.yaml abgeleitet. Englisch bleibt der Standard und die Source of Truth für jede Zeichenkette, die eine Übersetzung noch nicht abdeckt.

Profiles — Mehrere isolierte Hermes-Instanzen

Profiles geben Ihnen mehrere isolierte Hermes-Instanzen, jeweils mit eigener Konfiguration, eigenen Sitzungen, skills, eigenem Speicher und eigener gateway-PID. So können Sie „Arbeits-Hermes“ und „persönliches Hermes“ parallel ausführen, ohne dass eine Instanz den Zustand der anderen sieht.⁶

hermes profile list
hermes profile create work --clone                  # Clone from current profile
hermes profile use work                             # Set sticky default
hermes profile alias work --name h-work             # Create wrapper script
hermes profile export work -o work-backup.tar.gz
hermes profile import work-backup.tar.gz --name restored
hermes -p work chat -q "Hello from work profile"    # One-off without switching

Jedes profile erhält ein eigenes HERMES_HOME (standardmäßig ~/.hermes-<name>/), sodass mehrere profiles das gateway gleichzeitig ausführen können, ohne sich gegenseitig in die Quere zu kommen.⁶³

CLI-Befehle

Dieser Abschnitt ist die Praxisreferenz für CLI-Befehle auf oberster Ebene. Die maßgebliche, aus dem Code abgeleitete Referenz finden Sie in der upstream CLI Commands Reference.⁶

Globale Optionen

hermes [global-options] <command> [subcommand/options]

Option	Beschreibung
`--version`, `-V`	Version anzeigen und beenden
`--profile <name>`, `-p <name>`	Auswählen, welches Hermes-profile verwendet werden soll
`--resume <session>`, `-r <session>`	Eine Sitzung per ID oder Titel fortsetzen
`--continue [name]`, `-c [name]`	Die letzte Sitzung fortsetzen (oder einen Titel abgleichen)
`--worktree`, `-w`	In einem isolierten git worktree starten
`--yolo`	Bestätigungsabfragen für gefährliche Befehle umgehen
`--pass-session-id`	Die Sitzungs-ID in den system prompt des Agents aufnehmen

Befehle auf oberster Ebene

Befehl	Zweck
`hermes chat`	Interaktiver oder einmaliger Chat
`hermes model`	Standard-Provider und Modell interaktiv auswählen
`hermes gateway`	Das Messaging-gateway ausführen oder verwalten
`hermes setup`	Interaktiver Einrichtungsassistent
`hermes auth`	Zugangsdaten verwalten — hinzufügen, auflisten, entfernen, zurücksetzen, Strategie festlegen
`hermes status`	Agent-, Auth- und Plattformstatus anzeigen
`hermes cron`	Den cron Scheduler prüfen und ticken lassen
`hermes webhook`	Dynamische webhook-Abonnements verwalten
`hermes doctor`	Konfigurations- und Abhängigkeitsprobleme diagnostizieren
`hermes dump`	Kopierbare Einrichtungszusammenfassung für Support/Debugging
`hermes logs`	Agent-/gateway-/Fehlerlogs anzeigen, live verfolgen und filtern
`hermes config`	Konfiguration anzeigen, bearbeiten, migrieren und abfragen
`hermes pairing`	Messaging-Pairing-Codes genehmigen oder widerrufen
`hermes skills`	skills durchsuchen, installieren, veröffentlichen und auditieren
`hermes honcho`	Sitzungsübergreifenden Honcho-Speicher verwalten
`hermes memory`	Externen Speicher-Provider konfigurieren
`hermes acp`	Hermes als ACP-Server ausführen (Editor-Integration)
`hermes mcp`	MCP-Serverkonfiguration verwalten; Hermes als MCP-Server ausführen
`hermes plugins`	Plugins verwalten
`hermes tools`	Aktivierte Tools pro Plattform konfigurieren
`hermes sessions`	Sitzungen durchsuchen, exportieren, bereinigen und löschen
`hermes insights`	Token-/Kosten-/Aktivitätsanalysen anzeigen
`hermes claw`	OpenClaw-Migrationshilfen
`hermes profile`	profiles verwalten (mehrere isolierte Instanzen)
`hermes completion`	Shell-Completion-Skripte ausgeben (bash/zsh)
`hermes whatsapp`	Die WhatsApp-Bridge konfigurieren und koppeln
`hermes version`	Versionsinformationen ausgeben
`hermes update`	Neuesten Code abrufen und Abhängigkeiten neu installieren
`hermes uninstall`	Hermes vom System entfernen (`--full` löscht auch Konfiguration/Daten)
`hermes backup`	Vollständiges Backup von Konfiguration, Sitzungen, skills und Speicher (v0.9.0+)¹⁶
`hermes import`	Aus einem Backup-Archiv wiederherstellen — zwischen Maschinen migrieren oder zurückrollen (v0.9.0+)¹⁶
`hermes dashboard`	Das lokale Web-Dashboard für browserbasiertes Agent-Management starten (v0.9.0+)¹⁶
`hermes debug share`	Einen vollständigen Debug-Bericht zur Weitergabe bei der Fehlersuche in ein pastebin hochladen (v0.9.0+)¹⁶

`hermes chat` — Der Haupteinstiegspunkt

hermes ohne Argumente öffnet den interaktiven Chat. hermes chat ist die explizite Form mit Optionen:⁶

hermes chat -q "Summarize the latest PRs"           # One-shot, non-interactive
hermes chat --provider openrouter --model anthropic/claude-sonnet-4.6
hermes chat --toolsets web,terminal,skills          # Enable specific toolsets
hermes chat --quiet -q "Return only JSON"           # Programmatic mode
hermes chat --worktree -q "Review repo and open a PR"

Wichtige Optionen:

Option	Beschreibung
`-q`, `--query "..."`	Einmaliger, nicht interaktiver Prompt
`-m`, `--model <model>`	Das Modell für diesen Lauf überschreiben
`-t`, `--toolsets <csv>`	Einen kommaseparierten Satz von toolsets aktivieren
`--provider <provider>`	Einen Provider erzwingen (siehe vollständige Liste)
`-s`, `--skills <name>`	Einen oder mehrere skills für diese Sitzung vorladen
`-v`, `--verbose`	Ausführliche Ausgabe
`-Q`, `--quiet`	Programmatischer Modus (kein Banner, Spinner, keine Vorschauen)
`--resume <session>`	Eine Sitzung direkt aus `chat` fortsetzen
`--worktree`	Einen isolierten git worktree erstellen
`--checkpoints`	Dateisystem-checkpoints vor destruktiven Änderungen aktivieren
`--yolo`	Bestätigungsabfragen überspringen
`--source <tag>`	Sitzungsquellen-Tag (Standard: `cli`; verwenden Sie `tool` für Integrationen)
`--max-turns <N>`	Maximale Tool-Calling-Iterationen pro Turn (Standard: 90)

`hermes setup` — Vollständiger Assistent

Führt den vollständigen Einrichtungsassistenten aus oder springt direkt in einen Abschnitt:⁶

hermes setup                 # Full wizard
hermes setup model           # Provider and model only
hermes setup terminal        # Terminal backend only
hermes setup gateway         # Messaging platforms only
hermes setup tools           # Tool enable/disable per platform
hermes setup agent           # Agent behavior only
hermes setup --non-interactive
hermes setup --reset         # Reset config to defaults before setup

`hermes logs` — Strukturierte Log-Abfragen

hermes logs ist leistungsfähiger als tail -f auf den Logdateien, weil es das gleichzeitige Filtern nach Level, Sitzungs-ID und Zeitraum unterstützt.⁶

hermes logs                          # Last 50 lines of agent.log
hermes logs -f                       # Follow in real time
hermes logs gateway -n 100           # Last 100 lines of gateway.log
hermes logs --level WARNING --since 1h   # Warnings from the last hour
hermes logs --session abc123         # Filter by session ID substring
hermes logs errors --since 30m -f    # Follow errors.log from 30m ago
hermes logs list                     # List all log files with sizes

Logdateien liegen in ~/.hermes/logs/:⁶ - agent.log — alle Agent-Aktivitäten (API-Aufrufe, Tool-Dispatch, Sitzungslebenszyklus, INFO+) - errors.log — nur Warnungen und Fehler (eine gefilterte Teilmenge von agent.log) - gateway.log — Messaging-gateway-Aktivität (Plattformverbindungen, Dispatch, webhooks)

Die Rotation erfolgt automatisch über Pythons RotatingFileHandler — achten Sie auf agent.log.1, agent.log.2 usw.⁶

`hermes doctor` — Diagnostik

hermes doctor [--fix] ist der erste Befehl, den Sie ausführen sollten, wenn etwas nicht stimmt. Er prüft Konfigurationsgültigkeit, vorhandene Abhängigkeiten, Verfügbarkeit von API-Schlüsseln und Dienststatus und kann mit --fix automatische Reparaturen versuchen.⁶

Um Diagnosedaten mit jemand anderem zu teilen, verwenden Sie hermes dump — der Befehl erstellt eine kompakte Klartextzusammenfassung mit geschwärzten API-Schlüsseln, die Sie direkt in ein GitHub-Issue oder einen Discord-Thread einfügen können.⁶

Slash Commands

Slash Commands werden innerhalb einer aktiven Chat-Sitzung (CLI oder Messaging-Plattform) ausgeführt. Sie werden aus einer gemeinsamen COMMAND_REGISTRY in hermes_cli/commands.py heraus dispatcht, weshalb die meisten Commands auf allen Oberflächen identisch funktionieren.⁹

Sitzungssteuerung

Command	Beschreibung
`/new` (Alias `/reset`)	Neue Sitzung starten
`/clear`	Bildschirm leeren + neue Sitzung starten
`/history`	Gesprächsverlauf anzeigen
`/save`	Aktuelle Konversation speichern
`/retry`	Letzte Nachricht erneut versuchen
`/undo`	Letzten Benutzer-/Assistant-Austausch entfernen
`/title <name>`	Titel für die aktuelle Sitzung festlegen
`/compress`	Gesprächskontext manuell komprimieren
`/rollback [number]`	Dateisystem-checkpoints auflisten oder wiederherstellen
`/stop`	Alle laufenden Hintergrundprozesse beenden
`/queue <prompt>`	Prompt für den nächsten Turn in die Warteschlange stellen. Achtung: `/q` wird sowohl von `/queue` als auch von `/quit` beansprucht; die letzte Registrierung gewinnt, und `/q` löst in der Praxis `/quit` aus — tippen Sie immer ausdrücklich `/queue`.⁹
`/resume [name]`	Zuvor benannte Sitzung fortsetzen
`/statusbar` (Alias `/sb`)	Kontext-/Modell-Statusleiste umschalten
`/background <prompt>` (Alias `/bg`)	Prompt in einer separaten Hintergrundsitzung ausführen
`/btw <question>`	Flüchtige Nebenfrage (keine Tools, wird nicht persistiert)
`/plan [request]`	Gebündeltes `plan`-skill laden, um einen Plan zu schreiben statt auszuführen
`/branch [name]` (Alias `/fork`)	Aktuelle Sitzung branchen
`/goal <target>`	Agent auf ein Ziel festlegen, damit er über Turns hinweg bei der Aufgabe bleibt. Ralph-loop-Muster als Primitive erster Klasse. Konfigurierbares Turn-Budget. Neu in v0.13.0.¹⁸
`/subgoal <criterion>`	Erfolgskriterien zu einem aktiven `/goal` hinzufügen, ohne den Loop neu zu starten. Neu in v0.14.0.¹⁹
`/handoff <target>`	Live-Sitzung — Nachrichten, Tool-Aufrufe und Kontext — an ein anderes Modell, eine andere Persona oder ein anderes profile übertragen. Neu in v0.14.0.¹⁹

Konfiguration & Modell

Command	Beschreibung
`/config`	Aktuelle Konfiguration anzeigen
`/model [model-name]`	Aktuelles Modell anzeigen oder ändern
`/provider`	Verfügbare Provider und aktuellen Provider anzeigen
`/personality [name]`	Personality-Overlay festlegen
`/verbose`	Tool-Fortschrittsanzeige durchschalten
`/reasoning`	Reasoning-Aufwand und Anzeige verwalten
`/skin`	Anzeige-Skin/-Theme anzeigen oder ändern
`/voice [on\\|off\\|tts\\|status]`	Sprachmodus von CLI umschalten
`/yolo`	YOLO-Modus umschalten (Genehmigungs-Prompts überspringen)
`/fast`	Fast Mode umschalten — priorisierte Verarbeitung für OpenAI- und Anthropic-Modelle (v0.9.0+)¹⁶
`/debug`	Schnelldiagnose über alle Plattformen hinweg (v0.9.0+)¹⁶

Der /model-Command ist das Arbeitstier für Provider-Wechsel mitten in der Sitzung:⁹

/model                              # Show current model and options
/model claude-sonnet-4              # Switch model (auto-detect provider)
/model zai:glm-5                    # Switch provider:model
/model custom:qwen-2.5              # Use model on custom endpoint
/model custom                       # Auto-detect model from custom endpoint
/model custom:local:qwen-2.5        # Named custom provider
/model openrouter:anthropic/claude-sonnet-4   # Back to cloud

Tools, Skills & Infos

Command	Beschreibung
`/tools [list\\|disable\\|enable] [name...]`	Tools für die aktuelle Sitzung verwalten
`/toolsets`	Verfügbare toolsets auflisten
`/browser [connect\\|disconnect\\|status]`	Lokale Chrome-CDP-Verbindung verwalten
`/skills`	skills suchen, installieren, inspizieren oder verwalten
`/cron`	Geplante Aufgaben verwalten
`/reload-mcp`	MCP-Server aus config.yaml neu laden
`/plugins`	Installierte Plugins auflisten
`/help`	Alle Commands anzeigen
`/usage`	Token-Nutzung, Kosten, Dauer anzeigen
`/insights`	Nutzungsanalysen anzeigen (letzte 30 Tage)
`/platforms`	Status der Messaging-Plattform anzeigen
`/profile`	Aktiven profile-Namen und Home anzeigen

Dynamische Skill-Slash-Commands

Jedes installierte skill wird automatisch als Slash Command bereitgestellt:⁹

/gif-search funny cats
/axolotl help me fine-tune Llama 3 on my dataset
/github-pr-workflow create a PR for the auth refactor
/excalidraw       # Just the skill name loads it and lets the agent ask what you need

Sie können außerdem Quick Commands in config.yaml definieren, die einen Kurznamen als Alias für einen längeren Prompt verwenden:⁹

quick_commands:
  review: "Review my latest git diff and suggest improvements"
  deploy: "Run the deployment script at scripts/deploy.sh and verify the output"
  morning: "Check my calendar, unread emails, and summarize today's priorities"

Geben Sie anschließend /review, /deploy oder /morning in CLI ein.

Prefix Matching

Commands unterstützen Prefix Matching: Wenn Sie /h eingeben, wird dies zu /help aufgelöst; /mod wird zu /model aufgelöst. Ist ein Präfix mehrdeutig, gewinnt die erste Registrierung in der Registry-Reihenfolge. Vollständige Command-Namen und registrierte Aliasse haben immer Vorrang vor Prefix Matches.⁹

Messaging-spezifische Commands

Einige Commands funktionieren nur auf Messaging-Plattformen (Telegram, Discord, Slack, WhatsApp, Signal, E-Mail, Home Assistant):⁹

/status — Sitzungsinformationen anzeigen
/sethome (Alias /set-home) — aktuellen Chat als Plattform-Home markieren
/approve [session|always] — ausstehenden gefährlichen Command genehmigen
/deny — ausstehenden gefährlichen Command ablehnen
/update — Hermes Agent auf die neueste Version aktualisieren
/commands [page] — alle Commands und skills durchsuchen (paginiert)

Und einige funktionieren nur in CLI: /skin, /tools, /toolsets, /browser, /config, /cron, /skills, /platforms, /paste, /statusbar, /plugins.⁹

Tools & Toolsets

Hermes wird mit einer breiten integrierten Tool-Registry ausgeliefert, die Websuche, Browser-Automatisierung, Terminalausführung, Dateibearbeitung, Memory, Delegation, RL-Training, Messaging-Zustellung, Home Assistant-Integration und mehr abdeckt.¹⁰ Tools sind in logischen toolsets organisiert, die je nach Plattform aktiviert oder deaktiviert werden können.

Übergeordnete Kategorien

Kategorie	Beispiele	Beschreibung
Web	`web_search`, `web_extract`	Das Web durchsuchen und Seiteninhalte extrahieren
Terminal & Dateien	`terminal`, `process`, `read_file`, `patch`	Befehle ausführen und Dateien bearbeiten
Browser	`browser_navigate`, `browser_snapshot`, `browser_vision`	Interaktive Browser-Automatisierung mit Text und Vision
Medien	`vision_analyze`, `video_analyze`, `video_generate`, `image_generate`, `text_to_speech`	Multimodale Analyse und Generierung. `video_analyze` ist Gemini-first mit erweiterbarer Unterstützung für kompatible multimodale Provider (v0.13.0+). v0.14.0 ergänzt ein einheitliches `video_generate` mit austauschbaren Provider-Backends und leitet Rohpixel über `vision_analyze` weiter, wenn das aktive Modell vision-fähig ist.¹⁸¹⁹
Agent-Orchestrierung	`todo`, `clarify`, `execute_code`, `delegate_task`	Planung, Klärung, Codeausführung, Subagent-Delegation
Computer use	`computer_use`	Desktop-Steuerung über das cua-driver-Backend; ab v0.14.0 funktioniert dies mit nicht-Anthropic vision-fähigen Providern.¹⁹
Memory & Recall	`memory`, `session_search`	Persistentes Memory + Sitzungssuche
Automatisierung & Zustellung	`cronjob`, `send_message`	Geplante Aufgaben, ausgehendes Messaging
Integrationen	`ha_`, MCP Tools, `rl_`	Home Assistant, MCP, RL-Training

Zu den gängigen toolset-Namen gehören web, terminal, file, browser, vision, image_gen, moa, skills, tts, todo, memory, session_search, cronjob, code_execution, delegation, clarify, homeassistant und rl.¹⁰

Tools verwalten

hermes chat --toolsets "web,terminal"       # Use specific toolsets
hermes tools                                # Interactive per-platform tool config
hermes tools --summary                      # Print enabled-tools summary

Tools können auch während einer Sitzung über /tools disable <name> und /tools enable <name> umgeschaltet werden. Dadurch wird die Sitzung zurückgesetzt, damit das neue Toolset wirksam wird.⁹

Terminal-Backends

Das Terminal-Tool kann Befehle in 6 verschiedenen Umgebungen ausführen:¹⁰

Backend	Anwendungsfall
`local`	Auf Ihrem Rechner ausführen (Standard) — Entwicklung, vertrauenswürdige Aufgaben
`docker`	Isolierte Container — Sicherheit, Reproduzierbarkeit
`ssh`	Remote-Server — Sandbox, Agent vom eigenen Code fernhalten
`singularity`	HPC-Container — Cluster-Computing, rootless
`modal`	Serverless-Cloud-Ausführung
`daytona`	Cloud-Sandbox-Workspace — persistente Remote-Entwicklungsumgebung

Wechseln Sie Backends mit hermes config set terminal.backend <name> oder in config.yaml:

terminal:
  backend: docker      # or: local, ssh, singularity, modal, daytona
  cwd: "."             # Working directory
  timeout: 180         # Command timeout in seconds

SSH-Backend (aus Sicherheitsgründen empfohlen — der Agent kann seinen eigenen Code nicht ändern):¹⁰

terminal:
  backend: ssh

# In ~/.hermes/.env
TERMINAL_SSH_HOST=my-server.example.com
TERMINAL_SSH_USER=myuser
TERMINAL_SSH_KEY=~/.ssh/id_rsa

Docker-Backend:

terminal:
  backend: docker
  docker_image: python:3.11-slim

Container-Ressourcen (gilt für docker, singularity, modal, daytona):¹⁰

terminal:
  container_cpu: 1
  container_memory: 5120          # MB (default 5GB)
  container_disk: 51200           # MB (default 50GB)
  container_persistent: true      # Persist filesystem across sessions

Mit container_persistent: true bleiben installierte Pakete, Dateien und Konfigurationen sitzungsübergreifend erhalten.¹⁰

Alle Container-Backends laufen mit Sicherheitshärtung: schreibgeschütztes Root-Dateisystem (Docker), alle Linux-Capabilities außer DAC_OVERRIDE, CHOWN und FOWNER entfernt, keine Rechteausweitung, PID-Limits (256 Prozesse), vollständige Namespace-Isolation, persistenter Workspace über Volumes.¹⁰

Hintergrundprozesse

Das Terminal-Tool unterstützt Hintergrundausführung mit explizitem Prozessmanagement:¹⁰

terminal(command="pytest -v tests/", background=true)
# Returns: {"session_id": "proc_abc123", "pid": 12345}

process(action="list")                            # Show all running processes
process(action="poll", session_id="proc_abc123")  # Check status
process(action="wait", session_id="proc_abc123")  # Block until done
process(action="log", session_id="proc_abc123")   # Full output
process(action="kill", session_id="proc_abc123")  # Terminate
process(action="write", session_id="proc_abc123", data="y")  # Send input

Der PTY-Modus (pty=true) ermöglicht interaktive CLI Tools wie Codex und Claude Code.¹⁰

Sudo

Wenn ein Befehl sudo benötigt, fragt Hermes nach Ihrem Passwort (für die Sitzung zwischengespeichert). Alternativ setzen Sie SUDO_PASSWORD in ~/.hermes/.env.¹⁰

Multi-Agent-Kanban (v0.13.0+)

v0.13.0 macht Multi-Agent-Zusammenarbeit zu einem Primitive erster Klasse: ein dauerhaftes Kanban-Board, das Aufgaben, Status und Worker-Identität über Agents und Neustarts hinweg verfolgt.¹⁸ Erst dieses Board sorgt dafür, dass ein Schwarm von Hermes-Workern Arbeit tatsächlich abschließt, statt an toten Übergaben hängen zu bleiben.

Mechanismus	Funktion
Heartbeats	Jeder Worker sendet Pulse, solange er eine Aufgabe besitzt. Ein verpasster Heartbeat markiert den Worker als verdächtig und gibt die Aufgabe zur Rückforderung frei.
Reclaim	Ein anderer Worker kann eine aufgegebene Aufgabe übernehmen, einschließlich vollständigem Aufgabenstatus und bisheriger Teilergebnisse.
Zombie-Erkennung	Worker, die beendet werden, ohne eine Aufgabe als abgeschlossen zu markieren, werden automatisch daran gehindert, neue Arbeit zu beanspruchen. So sammelt der Schwarm keine tote Identität an.
Hallucination Gate	Output, der das Gate nicht besteht, schickt die Aufgabe mit vermerktem Grund zurück an das Board, statt sie als erledigt zu markieren.
`max_retries` pro Aufgabe	Überschreibt das standardmäßige Retry-Budget für eine Aufgabe, von der Sie wissen, dass sie fragil ist.
Multi-Projekt-Boards	Ein Hermes Home kann mehrere unabhängige Boards hosten.

Das Kanban-Board passt natürlich zu /goal (Locked-Target-Ralph-Loop) auf der Zielseite und zum vorhandenen delegate_task-Tool für Spawn-Semantik. Das Ergebnis ist ein Schwarmmuster, bei dem jeder Agent eine gemeinsame Quelle der Wahrheit dafür teilt, was als Nächstes zu tun ist, wer daran arbeitet und was feststeckt.

Skills System

Skills sind Wissensdokumente auf Abruf, die der Agent bei Bedarf laden kann. Sie folgen einem Progressive-Disclosure-Muster, um die Token-Nutzung zu minimieren, und sind mit dem offenen Standard agentskills.io kompatibel.¹¹

Alle Skills liegen in ~/.hermes/skills/ — dem primären Verzeichnis und der verbindlichen Quelle. Bei einer Neuinstallation werden gebündelte Skills aus dem Repo kopiert. Über den Hub installierte und vom Agent erstellte Skills landen ebenfalls hier.¹¹

Progressive Disclosure

Level 0: skills_list()           → [{name, description, category}, ...]   (~3k tokens)
Level 1: skill_view(name)        → Full content + metadata                 (varies)
Level 2: skill_view(name, path)  → Specific reference file                 (varies)

Der Agent lädt den vollständigen Skill-Inhalt nur dann, wenn er ihn tatsächlich benötigt.¹¹

SKILL.md-Format

---
name: my-skill
description: Brief description of what this skill does
version: 1.0.0
platforms: [macos, linux]      # Optional — restrict to OS platforms
metadata:
  hermes:
    tags: [python, automation]
    category: devops
    fallback_for_toolsets: [web]     # Conditional activation
    requires_toolsets: [terminal]    # Conditional activation
    config:                          # Config.yaml settings
      - key: my.setting
        description: "What this controls"
        default: "value"
        prompt: "Prompt for setup"
---

# Skill Title

## When to Use
Trigger conditions for this skill.

## Procedure
1. Step one
2. Step two

## Pitfalls
- Known failure modes and fixes

## Verification
How to confirm it worked.

Bedingte Aktivierung

Skills können sich je nach verfügbaren Tools ein- oder ausblenden. Das ist besonders nützlich für Fallback-Skills — kostenlose oder lokale Alternativen, die nur erscheinen sollten, wenn ein Premium-Tool nicht verfügbar ist:¹¹

Feld	Verhalten
`fallback_for_toolsets`	Skill wird ausgeblendet, wenn die aufgeführten toolsets verfügbar sind
`fallback_for_tools`	Dasselbe, prüft aber einzelne Tools
`requires_toolsets`	Skill wird ausgeblendet, wenn die aufgeführten toolsets nicht verfügbar sind
`requires_tools`	Dasselbe, prüft aber einzelne Tools

Beispiel: Der integrierte Skill duckduckgo-search verwendet fallback_for_toolsets: [web]. Wenn Sie FIRECRAWL_API_KEY gesetzt haben, ist das web-toolset verfügbar und der Agent verwendet web_search — der DuckDuckGo-Skill bleibt ausgeblendet. Ohne den API-Schlüssel erscheint der DuckDuckGo-Skill automatisch als Fallback.¹¹

Vom Agent verwaltete Skills

Der Agent kann über das Tool skill_manage eigene Skills erstellen, aktualisieren und löschen. Das ist das prozedurale Gedächtnis des Agenten — wenn er einen nicht trivialen Workflow versteht, speichert er den Ansatz als Skill für die spätere Wiederverwendung.¹¹

Wann der Agent Skills erstellt:¹¹ - Nachdem er eine komplexe Aufgabe (5+ Tool-Aufrufe) erfolgreich abgeschlossen hat - Wenn er auf Fehler oder Sackgassen gestoßen ist und den funktionierenden Weg gefunden hat - Wenn der Benutzer seinen Ansatz korrigiert hat - Wenn er einen nicht trivialen Workflow entdeckt hat

Aktionen:¹¹

Aktion	Verwendungszweck
`create`	Neuer Skill von Grund auf
`patch`	Gezielte Korrekturen (bevorzugt — am token-effizientesten)
`edit`	Größere strukturelle Überarbeitungen
`delete`	Einen Skill vollständig entfernen
`write_file`	Unterstützende Dateien hinzufügen/aktualisieren
`remove_file`	Eine unterstützende Datei entfernen

Skill Hub

Skills aus Online-Registries durchsuchen, suchen, installieren und verwalten:⁶¹¹

hermes skills browse                          # Browse all hub skills
hermes skills browse --source official        # Browse official optional skills
hermes skills search kubernetes               # Search all sources
hermes skills search react --source skills-sh # Search skills.sh directory
hermes skills inspect openai/skills/k8s       # Preview before installing
hermes skills install openai/skills/k8s       # Install with security scan
hermes skills install skills-sh/anthropics/skills/pdf --force
hermes skills check                           # Check for upstream updates
hermes skills update                          # Reinstall changed hub skills
hermes skills audit                           # Re-scan installed hub skills
hermes skills uninstall k8s
hermes skills publish skills/my-skill --to github --repo owner/repo
hermes skills tap add myorg/skills-repo       # Add custom GitHub source

Integrierte Hub-Quellen:¹¹

Quelle	Beispiel	Hinweise
`official`	`official/security/1password`	Optionale Skills, die mit Hermes ausgeliefert werden (builtin trust)
`skills-sh`	`skills-sh/vercel-labs/agent-skills/vercel-react-best-practices`	Öffentliches Skills-Verzeichnis von Vercel
`well-known`	`well-known:https://mintlify.com/docs/.well-known/skills/mintlify`	URL-basierte Erkennung von Websites, die `/.well-known/skills/index.json` veröffentlichen
`github`	`openai/skills/k8s`	Direkte GitHub-Repo-/Pfadinstallationen
`clawhub`	—	Drittanbieter-Marktplatz für Skills
`claude-marketplace`	—	Claude-kompatible Plugin-/Marketplace-Manifeste
`lobehub`	—	Konvertierung des LobeHub-Agentenkatalogs

Standard-GitHub-Taps (ohne Einrichtung durchsuchbar): openai/skills, anthropics/skills, VoltAgent/awesome-agent-skills, garrytan/gstack.¹¹

Sicherheitsscans

Alle über den Hub installierten Skills durchlaufen einen Sicherheitsscanner, der auf Datenexfiltration, Prompt Injection, destruktive Befehle, Supply-Chain-Signale und andere Bedrohungen prüft.¹¹

Vertrauensstufen:¹¹

Stufe	Quelle	Richtlinie
`builtin`	Wird mit Hermes ausgeliefert	Immer vertrauenswürdig
`official`	`optional-skills/` im Repo	Builtin trust, keine Drittanbieterwarnung
`trusted`	Vertrauenswürdige Registries (`openai/skills`, `anthropics/skills`)	Großzügigere Richtlinie
`community`	Alles andere	Nicht gefährliche Befunde können mit `--force` überstimmt werden; `dangerous`-Urteile bleiben blockiert

--force kann nicht gefährliche Richtlinienblockaden für Community-Skills überstimmen. Es überstimmt kein dangerous-Scanurteil.¹¹

Externe Skill-Verzeichnisse

Sie können Hermes auf zusätzliche Skill-Verzeichnisse verweisen lassen, die parallel zum lokalen Verzeichnis gescannt werden:¹¹

skills:
  external_dirs:
    - ~/.agents/skills
    - /home/shared/team-skills
    - ${SKILLS_REPO}/skills

Pfade unterstützen ~-Erweiterung und ${VAR}-Umgebungsvariablensubstitution. Externe Verzeichnisse sind schreibgeschützt — wenn der Agent einen Skill erstellt oder bearbeitet, schreibt er immer nach ~/.hermes/skills/. Lokale Priorität gewinnt, wenn ein Skill-Name an beiden Orten existiert.¹¹

Persistenter Speicher

Hermes verfügt über begrenzten, kuratierten Speicher, der sitzungsübergreifend erhalten bleibt. Zwei Dateien bilden den Speicher des Agenten, beide gespeichert unter ~/.hermes/memories/:¹²

Datei	Zweck	Zeichenlimit
`MEMORY.md`	Persönliche Notizen des Agenten — Umgebungsfakten, Konventionen, Gelerntes	2.200 Zeichen (~800 Tokens)
`USER.md`	Benutzerprofil — Präferenzen, Kommunikationsstil, Erwartungen	1.375 Zeichen (~500 Tokens)

Beide werden als eingefrorener Snapshot beim Sitzungsstart in den System-Prompt injiziert. Der Agent verwaltet seinen eigenen Speicher über das memory-Tool — add, replace oder remove.¹²

Muster des eingefrorenen Snapshots: Die System-Prompt-Injektion wird einmal beim Sitzungsstart erfasst und ändert sich während der Sitzung nicht mehr. Das ist Absicht — so bleibt der Prefix-Cache von LLM für bessere Performance erhalten. Änderungen, die während einer Sitzung vorgenommen werden, werden sofort auf die Festplatte geschrieben, erscheinen aber erst in der nächsten Sitzung im System-Prompt.¹²

Was gespeichert werden sollte

Speichern Sie Folgendes (der Agent tut dies proaktiv):¹² - Benutzerpräferenzen: „Ich bevorzuge TypeScript gegenüber JavaScript“ → user - Umgebungsfakten: „Dieser Server läuft mit Debian 12 und PostgreSQL 16“ → memory - Korrekturen: „Verwenden Sie für Docker-Befehle kein sudo, der Benutzer ist in der docker-Gruppe“ → memory - Konventionen: „Das Projekt verwendet Tabs, 120 Zeichen Zeilenbreite, Docstrings im Google-Stil“ → memory - Abgeschlossene Arbeit: „Datenbank am 15. Januar 2026 von MySQL zu PostgreSQL migriert“ → memory

Überspringen Sie Folgendes:¹² - Triviale/offensichtliche Informationen - Leicht erneut auffindbare Fakten - Rohdaten-Dumps (zu groß für den Speicher) - Sitzungsspezifische Momentaufnahmen - Informationen, die bereits in Kontextdateien stehen

Sitzungssuche

Neben MEMORY.md und USER.md kann der Agent seine früheren Gespräche mit dem Tool session_search durchsuchen. Alle CLI- und Messaging-Sitzungen werden in SQLite (~/.hermes/state.db) mit FTS5-Volltextsuche gespeichert. Abfragen liefern relevante frühere Gespräche mit Zusammenfassungen durch Gemini Flash zurück.¹²

Funktion	Persistenter Speicher	Sitzungssuche
Kapazität	Insgesamt ~1.300 Tokens	Unbegrenzt (alle Sitzungen)
Geschwindigkeit	Sofort (im System-Prompt)	Erfordert Suche + Zusammenfassung durch LLM
Anwendungsfall	Wichtige Fakten immer verfügbar	Bestimmte frühere Gespräche finden
Verwaltung	Manuell vom Agenten kuratiert	Automatisch — alle Sitzungen gespeichert
Token-Kosten	Fest pro Sitzung (~1.300 Tokens)	Bei Bedarf

Externe Speicheranbieter

Für tieferen persistenten Speicher über MEMORY.md und USER.md hinaus liefert Hermes acht Plugins für externe Speicheranbieter mit: Honcho, OpenViking, Mem0, Hindsight, Holographic, RetainDB, ByteRover und Supermemory.¹²

Externe Anbieter laufen parallel zum eingebauten Speicher (sie ersetzen ihn nie) und ergänzen Funktionen wie Knowledge Graphs, semantische Suche, automatische Faktenextraktion und sitzungsübergreifende Benutzermodellierung:⁶¹²

hermes memory setup         # Pick a provider and configure it
hermes memory status        # Check what's active
hermes memory off           # Disable external provider (built-in only)

Es kann immer nur ein externer Anbieter aktiv sein. Der eingebaute Speicher ist immer aktiv.⁶

Automatische Sitzungsfortsetzung (v0.13.0+)

v0.13.0 macht Unterbrechungen mitten in der Agentenarbeit überlebbar. Das gateway setzt unterbrochene Sitzungen nach einem Neustart automatisch fort; /update-Neustarts behalten den Sitzungszustand während des Upgrades bei; Quellcodedatei-Reloads während der Entwicklung halten die aktive Sitzung am Leben, statt eine neue zu erzwingen.¹⁸ Praktische Auswirkung: Lang laufende gateway-Arbeit und cron-gesteuerte Jobs setzen ihr Kontextfenster nicht mehr zurück, wenn der Prozess neu startet.

Checkpoints v2 (v0.13.0+)

Die Zustandspersistenz wurde in v0.13.0 als Single-Store-Design mit echtem Pruning, Festplatten-Schutzgrenzen und ohne verwaiste Shadow-Repos neu geschrieben.¹⁸ Das frühere checkpoint-System sammelte bei lang laufenden profiles Zustand auf der Festplatte an; der v2-Store setzt eine harte Obergrenze für lokalen checkpoint-Speicher und entfernt die doppelte Buchführung, die dieses Wachstum verursacht hat. Eine benutzerseitige Konfigurationsänderung ist nicht erforderlich; der nächste checkpoint-Schreibvorgang verwendet den v2-Pfad.

Persönlichkeit & SOUL.md

SOUL.md ist die primäre Identität einer Hermes-Instanz. Sie belegt Slot #1 im System-Prompt und ersetzt die fest codierte Standardidentität.¹³

Hermes legt automatisch eine Standard-SOUL.md unter ~/.hermes/SOUL.md an (oder $HERMES_HOME/SOUL.md für benutzerdefinierte profiles). Vorhandene Benutzerdateien werden nie überschrieben. Hermes lädt SOUL.md nur aus HERMES_HOME — es sucht nicht im aktuellen Arbeitsverzeichnis. Dadurch bleibt die Persönlichkeit projektübergreifend vorhersehbar.¹³

Was in SOUL.md gehört

Verwenden Sie sie für dauerhafte Vorgaben zu Stimme und Persönlichkeit:¹³ - Ton - Kommunikationsstil - Grad der Direktheit - Standard-Interaktionsstil - was stilistisch vermieden werden sollte - wie Hermes mit Unsicherheit, Widerspruch und Mehrdeutigkeit umgehen soll

Weniger geeignet ist sie für:¹³ - einmalige Projektanweisungen - Dateipfade - Repo-Konventionen - temporäre Workflow-Details

Diese gehören in AGENTS.md, nicht in SOUL.md.

SOUL.md vs AGENTS.md

Das ist die wichtigste Unterscheidung im Identitätsmanagement von Hermes:¹³

SOUL.md — Identität, Ton, Stil, Kommunikationsstandards, Verhalten auf Persönlichkeitsebene.

AGENTS.md — Projektarchitektur, Coding-Konventionen, Tool-Präferenzen, repo-spezifische Workflows, Befehle, Ports, Pfade, Deployment-Notizen.

Eine nützliche Regel: Wenn es Sie überall begleiten soll, gehört es in SOUL.md. Wenn es zu einem Projekt gehört, gehört es in AGENTS.md.¹³

Eingebaute Persönlichkeiten

Hermes bringt eingebaute Persönlichkeiten mit, zu denen Sie mit /personality wechseln können:¹³

Name	Beschreibung
`helpful`	Freundlicher Allzweck-Assistent
`concise`	Kurze, auf den Punkt gebrachte Antworten
`technical`	Detaillierter, präziser Technikexperte
`creative`	Innovatives Denken über gewohnte Grenzen hinaus
`teacher`	Geduldiger Lehrender mit klaren Beispielen
`kawaii`	Niedliche Ausdrücke, Glitzer, Begeisterung
`catgirl`	Neko-chan mit katzenartigen Ausdrücken
`pirate`	Captain Hermes, technikversierter Freibeuter
`shakespeare`	Bardische Prosa mit dramatischem Flair
`surfer`	Entspannte Bro-Vibes
`noir`	Erzählweise eines abgebrühten Detektivs
`uwu`	Maximale Niedlichkeit mit uwu-Sprache
`philosopher`	Tiefe Betrachtung zu jeder Anfrage
`hype`	MAXIMALE ENERGIE

Benutzerdefinierte Persönlichkeiten in config.yaml:¹³

agent:
  personalities:
    codereviewer: >
      You are a meticulous code reviewer. Identify bugs, security issues,
      performance concerns, and unclear design choices. Be precise and constructive.

Wechseln Sie anschließend mit /personality codereviewer.

SOUL.md vs `/personality`

SOUL.md ist die grundlegende Stimme. /personality ist ein Overlay auf Sitzungsebene.¹³ Halten Sie eine pragmatische Standard-SOUL.md vor und verwenden Sie dann /personality teacher für ein Tutoriumsgespräch oder /personality creative für Brainstorming.

Nous Tool Gateway (v0.10.0+)

Seit Hermes Agent v0.10.0 (16. April 2026) erhalten zahlende Nous Portal-Abonnenten verwalteten Zugriff auf einen kuratierten Satz von Tools über ihre bestehenden Portal-Zugangsdaten — ohne zusätzliche API-Schlüssel verwalten zu müssen.²⁶ CLI von Hermes selbst bleibt MIT-lizenziert und vollständig Open Source. Geändert hat sich, dass Ihre Portal-Authentifizierung jetzt mehr freischaltet als nur Modellinferenz.

Was im gateway enthalten ist

Tool	Anbieter	Anwendungsfall
Websuche	Firecrawl	Retrieval für Agenten, die aktuelle Informationen benötigen
Bildgenerierung	FAL / FLUX 2 Pro	Bilder inline generieren, ohne einen FAL-Schlüssel zu konfigurieren
Text-to-Speech	OpenAI TTS	Gesprochene Ausgabe auf Messaging-gateways
Browserautomatisierung	Browser Use	Headless-Navigation und Scraping

Funktionsweise

Das gateway ist pro Tool opt-in über ein neues use_gateway-Konfigurationsfeld. Wenn Sie Portal-Zugangsdaten in hermes auth haben und das gateway für ein Tool aktivieren, werden die Aufrufe dieses Tools über Portal geleitet. Andernfalls wird Ihr direkter API-Schlüssel verwendet, sofern vorhanden.

# config.yaml — per-tool gateway opt-in
tools:
  web_search:
    provider: firecrawl
    use_gateway: true          # route via Nous Portal subscription
  image_generation:
    provider: fal
    use_gateway: true

Runtime-Priorität: Wenn das gateway verfügbar ist und ein Tool use_gateway: true gesetzt hat, bevorzugt Hermes das gateway, selbst wenn Sie zusätzlich einen direkten API-Schlüssel konfiguriert haben. Das ist für die Abrechnung wichtig — gateway-Aufrufe werden Ihrer Portal-Subscription belastet, nicht dem Guthaben Ihres direkten API-Schlüssels.

Gateway aktivieren

hermes model                      # select Nous Portal (OAuth flow)
hermes tools                      # per-platform tool picker integrates gateway tools
hermes status                     # confirms gateway/subscription detection

Es gibt keinen separaten Befehl hermes subscribe oder hermes login --portal. Die Subscription wird automatisch anhand der Portal-OAuth-Zugangsdaten erkannt, die Sie bereits in hermes auth haben.

Preise und Zugriff

Preise und Tier-Namen werden auf der Preisseite des Nous Portal veröffentlicht (https://portal.nousresearch.com/pricing). Dieser Guide zählt die Tiers nicht auf, weil sie in die Verantwortung des Portal-Produkts fallen, nicht von Hermes CLI, und sich unabhängig von Hermes-Releases ändern. Registrieren Sie sich unter https://portal.nousresearch.com/ und prüfen Sie die Preisseite für die aktuellen Tiers.

Deprecation-Hinweis

Die Umgebungsvariable HERMES_ENABLE_NOUS_MANAGED_TOOLS wurde in v0.10.0 entfernt. Managed Tools werden jetzt über das pro Tool gesetzte Konfigurationsfeld use_gateway aktiviert und anhand des Zustands Ihrer Portal-Subscription freigeschaltet.²⁶

Einordnung: Was dieses Release nicht ist

Hermes Agent CLI ist nicht hinter einer Subscription gesperrt. Das Projekt bleibt MIT-lizenziert, alle Kernfunktionen (CLI, skills, Speicher, Messaging-gateway, cron, MCP, lokales Dashboard, BYOK für jeden Anbieter) funktionieren end-to-end, ohne jemanden zu bezahlen. v0.10.0 ergänzt einen Komfortpfad für Benutzer, die bereits für Nous Portal bezahlen — es entfernt nichts aus dem kostenlosen Pfad.

Messaging Gateway

Hermes kann als dauerhaft laufender gateway-Prozess betrieben werden, der über einen einzigen gateway-Prozess mit 22 Messaging-Plattformen verbunden ist: Telegram, Discord, Slack, WhatsApp, Signal, SMS, Email, Home Assistant, Mattermost, Matrix, DingTalk, Feishu/Lark, WeCom, Weixin (WeChat), BlueBubbles (iMessage), QQBot, Microsoft Teams, Tencent Yuanbao, Google Chat, LINE, SimpleX Chat und ein generischer Webhook-Adapter.³²⁵¹⁷¹⁸¹⁹ v0.9.0 ergänzte iMessage über BlueBubbles (automatische Webhook-Registrierung, Einrichtungsassistent, Absturzresilienz) sowie native WeChat-Unterstützung über iLink Bot API mit WeCom-Callback-Modus für Unternehmens-Apps.¹⁶ v0.11.0 ergänzte QQBot.²⁵ v0.12.0 ergänzte Microsoft Teams und Tencent Yuanbao.¹⁷ v0.13.0 ergänzte Google Chat als 20. Plattform auf Basis derselben steckbaren Adapterarchitektur; IRC und Microsoft Teams wurden außerdem auf das neue Adaptermuster mit generischen env_enablement_fn- / cron_deliver_env_var-Plugin-Hooks migriert.¹⁸ v0.14.0 ergänzt LINE und SimpleX Chat und vervollständigt den Microsoft Teams-Stack Ende-zu-Ende mit Graph-Authentifizierung, Webhook-Listener, Pipeline-Laufzeit und ausgehender Zustellung.¹⁹ v0.17.0 (19. Juni 2026) ergänzt relay-freies iMessage über Photon Spectrum (device-code OAuth mit hermes photon login — kein Mac-/BlueBubbles-Relay erforderlich), den offiziellen WhatsApp Business Cloud API-Adapter (ersetzt die Bridge-Prozess-Anforderung), SimpleX-Gruppen und native Anhänge sowie Raft als gebündeltes Plattform-Plugin.²¹

Einrichtung

hermes gateway setup                # Interactive platform configuration
hermes gateway install              # Install as user service (systemd/launchd)
hermes gateway start                # Start the installed service
hermes gateway stop
hermes gateway restart
hermes gateway status
hermes gateway run                  # Run in foreground (debugging)

Die interaktive Einrichtung führt Sie durch die Verbindung jeder Plattform: API-Tokens, Bot-IDs, Kanalzuordnungen, Allowlists.⁶

Nachrichtenfluss

Aus den Upstream-Architekturdokumenten:³

Platform event → Adapter.on_message() → MessageEvent
  → GatewayRunner._handle_message()
    → authorize user
    → resolve session key
    → create AIAgent with session history
    → AIAgent.run_conversation()
    → deliver response back through adapter

Jede Messaging-Plattform läuft durch dieselbe AIAgent-Konversationsschleife wie der CLI. Deshalb funktionieren Slash-Befehle an beiden Stellen identisch, und deshalb kann ein in Telegram geplanter cron-Job seine Ausgabe an Discord liefern — der Plattformunterschied liegt nur am Rand.³

Benutzerautorisierung und Pairing

hermes pairing list                    # Show pending and approved users
hermes pairing approve <platform> <code>
hermes pairing revoke <platform> <user-id>
hermes pairing clear-pending

Pairing-Codes verhindern, dass beliebige Fremde mit Ihrem gateway sprechen. Ein Benutzer sendet einen Pairing-Code von seiner Messaging-Plattform; Sie genehmigen ihn mit hermes pairing approve; ab dann ist er autorisiert.⁶

Geplante Aufgaben (Cron)

Hermes hat ein erstklassiges cron-System, in dem Jobs Agent-Aufgaben sind, keine Shell-Befehle. Jeder geplante Job läuft durch einen frischen AIAgent mit dem konfigurierten Prompt, optional angehängten skills, und liefert Ergebnisse an jede Plattform:³⁶

hermes cron list
hermes cron create --prompt "Check HN for AI news and summarize" --schedule "0 9 * * *" --deliver telegram
hermes cron edit <id>
hermes cron pause <id>
hermes cron resume <id>
hermes cron run <id>         # Trigger now on the next tick
hermes cron remove <id>
hermes cron status           # Check if scheduler is running
hermes cron tick             # Run due jobs once and exit

Oder erstellen Sie einen Job konversationell innerhalb eines Messaging-Chats:

Every morning at 9am, check Hacker News for AI news and send me a summary on Telegram.

Der Agent richtet den cron-Job über seine Tools ein. Jobs bleiben in JSON bestehen und überstehen Neustarts.³

MCP-Integration

Hermes unterstützt das Model Context Protocol sowohl als Client als auch als Server:⁶

Als Client — verbinden Sie Hermes mit externen MCP-Servern, um seine Tool-Oberfläche zu erweitern:

hermes mcp add <name> --url https://example.com/mcp
hermes mcp add <name> --command npx --args "-y,@modelcontextprotocol/server-github"
hermes mcp list
hermes mcp test <name>
hermes mcp remove <name>
hermes mcp configure <name>   # Toggle individual tool selection

Oder manuell in config.yaml:¹⁴

mcp_servers:
  github:
    command: npx
    args: ["-y", "@modelcontextprotocol/server-github"]
    env:
      GITHUB_PERSONAL_ACCESS_TOKEN: "ghp_xxx"

Als Server — stellen Sie Hermes-Konversationen anderen Agenten bereit:

hermes mcp serve
hermes mcp serve -v    # Verbose

Kontextkomprimierung

Hermes komprimiert lange Konversationen automatisch, damit sie innerhalb des Kontextfensters Ihres Modells bleiben. Der Komprimierungs-Summarizer ist ein separater LLM-Aufruf — Sie können ihn auf jeden Provider oder Endpoint ausrichten.⁴

compression:
  enabled: true
  threshold: 0.50                           # Compress at this % of context limit
  target_ratio: 0.20                        # Fraction to preserve as recent tail
  protect_last_n: 20                        # Min recent messages to keep uncompressed
  summary_model: "google/gemini-3-flash-preview"
  summary_provider: "auto"                  # "auto", "openrouter", "nous", "codex", "main", etc.
  summary_base_url: null                    # Custom OpenAI-compatible endpoint

Provider-Optionen:⁴

`summary_provider`	`summary_base_url`	Ergebnis
`auto` (Standard)	nicht gesetzt	Besten verfügbaren Provider automatisch erkennen
`nous` / `openrouter` / etc.	nicht gesetzt	Diesen Provider erzwingen, dessen Authentifizierung verwenden
beliebig	gesetzt	Den benutzerdefinierten Endpoint direkt verwenden (Provider ignoriert)

summary_model muss eine Kontextlänge unterstützen, die mindestens so groß ist wie die Ihres Hauptmodells, da es den vollständigen mittleren Abschnitt der Konversation zur Komprimierung erhält.⁴

Warnungen bei Budgetdruck

Wenn der Agent an einer komplexen Aufgabe mit vielen Tool-Aufrufen arbeitet, kann er sein Iterationsbudget (Standard: 90 Durchläufe) verbrauchen, ohne es zu merken. Budgetdruck warnt das Modell automatisch:⁴

Schwellenwert	Stufe	Was das Modell sieht
70%	Vorsicht	`[BUDGET: 63/90. 27 iterations left. Start consolidating.]`
90%	Warnung	`[BUDGET WARNING: 81/90. Only 9 left. Respond NOW.]`

Stream-Timeouts

Die LLM-Streaming-Verbindung hat zwei Timeout-Ebenen, die sich für lokale Provider (localhost, LAN-IPs) automatisch anpassen:⁴

Timeout	Standard	Lokale Provider	Env var
Socket-Lesetimeout	120s	Automatisch auf 1800s erhöht	`HERMES_STREAM_READ_TIMEOUT`
Erkennung veralteter Streams	180s	Automatisch deaktiviert	`HERMES_STREAM_STALE_TIMEOUT`
API-Aufruf (nicht streamend)	1800s	Unverändert	`HERMES_API_TIMEOUT`

Der Socket-Lesetimeout wird für lokale Endpoints auf 30 Minuten erhöht, weil lokale LLMs bei großen Kontexten mehrere Minuten für den Prefill benötigen können, bevor sie das erste Token erzeugen.⁴

Lokales Web-Dashboard (v0.9.0+)

Ein browserbasiertes Dashboard zur lokalen Verwaltung Ihres Hermes Agent. Konfigurieren Sie Einstellungen, überwachen Sie Sitzungen, durchsuchen Sie skills und verwalten Sie Ihr gateway, ohne Konfigurationsdateien oder das Terminal anzufassen.¹⁶ Starten Sie es mit hermes dashboard. Dies ist der einfachste Onboarding-Pfad für neue Benutzer, die eine GUI bevorzugen.

Überwachung von Hintergrundprozessen (v0.9.0+)

Mit watch_patterns können Sie Muster festlegen, die in der Ausgabe von Hintergrundprozessen überwacht werden, und Sie werden in Echtzeit benachrichtigt, sobald sie übereinstimmen.¹⁶ Überwachen Sie Fehler, warten Sie auf bestimmte Ereignisse (“listening on port”) oder beobachten Sie Build-Logs — ganz ohne Polling. Zusammen mit notify_on_complete aus v0.8.0 (das bei Abschluss von Hintergrundaufgaben benachrichtigt) verfügt Hermes nun über eine vollständige Beobachtungsebene für Hintergrundprozesse.¹⁵

Steckbarer context engine (v0.9.0+)

Das Kontextmanagement ist jetzt über hermes plugins ein steckbarer Slot. Tauschen Sie benutzerdefinierte context engines ein, die steuern, was der Agent in jedem Durchlauf sieht — Filterung, Zusammenfassung oder domänenspezifische Kontextinjektion.¹⁶ Dadurch wird die Kontextstrategie von der zentralen Agent-Schleife entkoppelt, sodass der Kontext pro Projekt oder Domäne angepasst werden kann.

Backup und Wiederherstellung (v0.9.0+)

hermes backup erstellt ein vollständiges Archiv Ihrer Konfiguration, Sitzungen, skills und memory. hermes import stellt aus einem Backup-Archiv wieder her.¹⁶ Verwenden Sie dies, um zwischen Maschinen zu migrieren, Snapshots vor größeren Änderungen zu erstellen oder eine bewährte Konfiguration mit Teamkollegen zu teilen.

Termux-/Android-Unterstützung (v0.9.0+)

Hermes läuft nativ auf Android über Termux. Angepasste Installationspfade, TUI-Optimierungen für mobile Bildschirme, Unterstützung für Voice-Backends und der Befehl /image funktionieren direkt auf dem Gerät.¹⁶

Security-Härtung (v0.13.0+)

v0.13.0 hat 8 P0-Sicherheitsprobleme geschlossen und eine Standardeinstellung zugunsten des Benutzers geändert.¹⁸ v0.14.0 folgt mit weiteren 12 P0- und 50 P1-Schließungen, darunter Härtung gegen sudo-Brute-Force / sudo-stdin, Korrekturen für Dangerous-Command-Bypässe, Tool-Error-Bereinigung vor der erneuten Einspeisung ins Modell, Dashboard-Plugin-API-Auth, SSRF-Abdeckung im Skills-Hub und Supply-Chain-Advisory-Scanning während der Installation.¹⁹

Fix	Was sich geändert hat
Secret-Redaction standardmäßig aktiviert	Zuvor Opt-in. Logs und Uploads über `hermes debug share` schwärzen Secrets, sofern dies nicht ausdrücklich deaktiviert wird. v0.12.0 hatte Redaction nach Berichten über Payload-Korruption standardmäßig deaktiviert; v0.13.0 aktiviert sie wieder als sicherere Ausgangsbasis.
Discord-Cross-Guild-DM-Bypass (CVSS 8.1)	Discord-Rollen-Allowlists sind jetzt auf Guilds beschränkt. Damit wird ein Pfad geschlossen, bei dem eine Benutzerrolle auf einer Guild DMs über alle Guilds hinweg autorisierte.
WhatsApp-Standardeinschränkungen	Der WhatsApp-Adapter weist unbekannte Personen standardmäßig ab und antwortet nie im Selbst-Chat.
MCP OAuth TOCTOU-Fenster	Eine Race Condition beim Speichern von Zugangsdaten in MCP-OAuth-Flows wurde geschlossen.
CLI `auth.json` TOCTOU	Ein entsprechendes TOCTOU-Fenster im Credential Writer für den CLI-Auth-Store wurde geschlossen.
Browser-SSRF-Untergrenze	Hybrid Routing erzwingt eine Cloud-Metadata-SSRF-Untergrenze gegen Anfragen, die `169.254.169.254` und entsprechende Ziele erreichen wollen.
Cron-Prompt-Injection-Scanning	Zusammengesetzte Prompts, einschließlich geladener skill-Inhalte, werden vor der Ausführung des Cron-Jobs auf Prompt Injection geprüft.
Redaction bei `hermes debug share`	Debug-Share-Uploads schwärzen Log-Inhalte beim Upload, nicht nur beim Schreiben.

Wenn Sie eine Hermes-Bereitstellung betreiben, behandeln Sie v0.13.0 und v0.14.0 als sicherheitsrelevante Upgrades, nicht nur als Feature-Releases. v0.13.0 schließt den Discord-Cross-Guild-Bypass und zwei TOCTOU-Fenster; v0.14.0 ergänzt eine weitere Härtungsrunde für sudo-Handling, Tool-Error-Reinjection, Plugin-APIs, Skills-Hub-SSRF und Dependency-Advisories.

Architektur für Praktiker

Dieser Abschnitt richtet sich an Personen, die verstehen möchten, was unter der Haube passiert, damit sie es debuggen, erweitern oder die Performance einschätzen können. Er ist eine Synthese der Upstream-Architekturdokumentation.³

Entry Points → AIAgent

Jeder Entry Point in Hermes ruft letztlich AIAgent.run_conversation() auf:

┌──────────────────────────────────────────────────────────────────┐
│                        Entry Points                              │
│                                                                  │
│  CLI (cli.py)    Gateway (gateway/run.py)    ACP (acp_adapter/)  │
│  Batch Runner    API Server                  Python Library     │
└──────────┬──────────────┬───────────────────────┬────────────────┘
           │              │                       │
           ▼              ▼                       ▼
┌──────────────────────────────────────────────────────────────────┐
│                     AIAgent (run_agent.py)                       │
│                                                                  │
│  ┌─────────────┐  ┌──────────────┐  ┌──────────────┐             │
│  │ Prompt      │  │ Provider     │  │ Tool         │             │
│  │ Builder     │  │ Resolution   │  │ Dispatch     │             │
│  └──────┬──────┘  └──────┬───────┘  └──────┬───────┘             │
│         │                │                 │                    │
│  ┌──────┴───────┐ ┌──────┴───────┐  ┌──────┴───────┐             │
│  │ Compression  │ │ 3 API Modes  │  │ Tool Registry│             │
│  │ & Caching    │ │ chat_compl   │  │ 47 tools     │             │
│  │              │ │ codex_resp   │  │ 20 toolsets  │             │
│  │              │ │ anthropic    │  │              │             │
│  └──────────────┘ └──────────────┘  └──────────────┘             │
└──────────────────────────────────────────────────────────────────┘

Diagramm nach der Upstream-Architekturdokumentation.³

„47 tools / 20 toolsets“ vs. „28 tools“ in Ihrem Banner. Die Angabe „47 tools“ bezeichnet die gesamte Tool-Registry des Upstream-Repositorys, also jedes Tool, für das Hermes Quellcode mitliefert, über alle toolsets hinweg. Ihre tatsächlich laufende CLI zeigt im Startbanner eine kleinere Zahl an (die Installation, gegen die ich diesen Leitfaden geprüft habe, meldet 28 tools / 89 skills). Das ist kein Bug. Viele toolsets sind opt-in und müssen in config.yaml unter toolsets: ausdrücklich aktiviert werden, etwa Adapter für Messaging-Plattformen, Browser-Automatisierung, umfangreichere Scraping-Tools usw. Die Registry-Gesamtzahl bedeutet „was verfügbar ist“; die Banner-Zahl bedeutet „was in Ihrem aktuellen profile aktiviert ist“. Prüfen Sie mit hermes tools --list, welche toolsets aktiv sind, und aktivieren oder deaktivieren Sie einzelne toolsets mit dem Block toolsets: in ~/.hermes/config.yaml (oder mit /tools list / /tools enable <name> / /tools disable <name> innerhalb einer laufenden Sitzung. Das Entfernen eines Tools löst einen Sitzungsreset aus, damit der Agent sein Tool-Manifest neu aufbaut).

Die drei API-Modi

Hermes abstrahiert Provider-Unterschiede in drei API-Modi, die zur Laufzeit automatisch ausgewählt werden:³

API-Modus	Verwendet von
`chat_completions`	OpenRouter, z.ai, Kimi, MiniMax, DeepSeek, Alibaba, die meisten Custom-Endpoints, jeder OpenAI-kompatible Server
`codex_responses`	OpenAI Codex (über ChatGPT OAuth)
`anthropic_messages`	Anthropic API (nativ), Anthropic OAuth, Anthropic-kompatible Proxys

Der Resolver runtime_provider.py ordnet (provider, model)-Tupel für mehr als 18 Provider (api_mode, api_key, base_url) zu und behandelt dabei OAuth-Flows, Credential Pools und Alias-Auflösung.³

Datenfluss durch eine CLI-Sitzung

User input → HermesCLI.process_input()
  → AIAgent.run_conversation()
    → prompt_builder.build_system_prompt()
    → runtime_provider.resolve_runtime_provider()
    → API call (chat_completions / codex_responses / anthropic_messages)
    → tool_calls? → model_tools.handle_function_call() → loop
    → final response → display → save to SessionDB

Von der Upstream-Architekturseite.³

Reihenfolge der Prompt-Zusammensetzung

Der Prompt-Stack enthält:¹³

SOUL.md (Agent-Identität, oder eingebauter Fallback, falls nicht verfügbar)
Tool-aware Verhaltensanweisungen
Memory-/Benutzerkontext (MEMORY.md, USER.md)
Skills-Anweisungen
Kontextdateien (AGENTS.md, .cursorrules)
Zeitstempel
Plattformspezifische Formatierungshinweise
Optionale System-Prompt-Overlays wie /personality

SOUL.md ist das Fundament; alles Weitere baut darauf auf.¹³

Sitzungsspeicher

SQLite-basierter Sitzungsspeicher mit FTS5-Volltextsuche. Sitzungen haben Lineage-Tracking (Parent/Child über Komprimierungen hinweg), Isolation pro Plattform und atomare Schreibvorgänge mit Contention-Handling.³

Plugin-System

Drei Discovery-Quellen: ~/.hermes/plugins/ (Benutzer), .hermes/plugins/ (Projekt) und pip-Entry-Points. Plugins registrieren Tools, Hooks und CLI-Befehle über einen Kontext-API. Memory Providers sind ein spezialisierter Plugin-Typ unter plugins/memory/.³

hermes plugins                       # Interactive enable/disable UI
hermes plugins install <repo>        # Install from Git URL or owner/repo
hermes plugins enable <name>
hermes plugins disable <name>
hermes plugins list

Designprinzipien

Von der Upstream-Architekturseite:³

Prinzip	Was das in der Praxis bedeutet
Prompt-Stabilität	Der System-Prompt ändert sich nicht mitten in der Unterhaltung. Keine Cache-brechenden Mutationen außer ausdrücklichen Benutzeraktionen (`/model`)
Beobachtbare Ausführung	Jeder Tool-Aufruf ist für den Benutzer über Callbacks sichtbar. Fortschrittsupdates in CLI (Spinner) und gateway (Chat-Nachrichten)
Unterbrechbar	API-Aufrufe und Tool-Ausführung können während der Ausführung durch Benutzereingaben oder Signale abgebrochen werden
Plattformunabhängiger Kern	Eine `AIAgent`-Klasse bedient CLI, gateway, ACP, Batch und API-Server. Plattformunterschiede liegen im Entry Point
Lose Kopplung	Optionale Subsysteme (MCP, Plugins, Memory Providers, RL-Umgebungen) verwenden Registry-Patterns und check_fn-Gating, keine harten Abhängigkeiten
Profile-Isolation	Jedes profile erhält sein eigenes `HERMES_HOME`, seine eigene Konfiguration, Memory, Sitzungen und gateway-PID. Mehrere profiles laufen parallel

Migration von OpenClaw

Hermes Agent ist der Nachfolger von OpenClaw. Wenn Sie von einer bestehenden OpenClaw-Installation migrieren:⁶⁵

hermes claw migrate --dry-run                    # Preview what would be migrated
hermes claw migrate --preset full                # Full migration including API keys
hermes claw migrate --preset user-data --overwrite   # User data only, no secrets
hermes claw migrate --source /custom/path        # Non-default OpenClaw location

hermes claw migrate liest standardmäßig aus ~/.openclaw (erkennt außerdem automatisch alte Verzeichnisse ~/.clawdbot und ~/.moldbot) und schreibt nach ~/.hermes.⁶

Direkt importiert (über 30 Kategorien): SOUL.md, MEMORY.md, USER.md, AGENTS.md, skills aus 4 Quellverzeichnissen, Standardmodell, Custom Providers, MCP-Server, Tokens und Allowlists für Messaging-Plattformen (Telegram, Discord, Slack, WhatsApp, Signal, Matrix, Mattermost), Agent-Defaults (Reasoning Effort, Komprimierung, Human Delay, Zeitzone, Sandbox), Sitzungsreset-Richtlinien, Genehmigungsregeln, TTS-Konfiguration, Browsereinstellungen, Tool-Einstellungen, Exec-Timeout, Command-Allowlist, gateway-Konfiguration und API-Schlüssel aus 3 Quellen.⁶

Für manuelle Prüfung archiviert: Cron-Jobs, Plugins, Hooks/Webhooks, Memory Backend (QMD), Skills-Registry-Konfiguration, UI/Identität, Logging, Multi-Agent-Setup, Channel Bindings, IDENTITY.md, TOOLS.md, HEARTBEAT.md, BOOTSTRAP.md.⁶

Die API-Schlüsselauflösung prüft drei Quellen in dieser Prioritätsreihenfolge: Konfigurationswerte → ~/.openclaw/.env → auth-profiles.json.⁶

Fehlerbehebung

“API key not set”

Führen Sie hermes model aus, um Ihren Provider interaktiv zu konfigurieren, oder hermes config set OPENROUTER_API_KEY your_key. Der Befehl hermes doctor zeigt Ihnen genau, welche Schlüssel fehlen.⁷

“Context limit: 2048 tokens” beim Start (lokale Modelle)

Hermes erkennt die Kontextlänge automatisch über den /v1/models-Endpunkt Ihres Servers, aber viele lokale Server melden niedrige Standardwerte. Legen Sie sie in config.yaml explizit fest:²

model:
  default: your-model
  provider: custom
  base_url: http://localhost:11434/v1
  context_length: 32768

Tool-Aufrufe erscheinen als Text, statt ausgeführt zu werden

Auf Ihrem Server ist Tool Calling nicht aktiviert, oder das Modell unterstützt es über die Serverimplementierung nicht.²

Server	Behebung
llama.cpp	Fügen Sie dem Startbefehl `--jinja` hinzu
vLLM	Fügen Sie `--enable-auto-tool-choice --tool-call-parser hermes` hinzu
SGLang	Fügen Sie `--tool-call-parser qwen` hinzu (oder den passenden Parser)
Ollama	Tool Calling ist standardmäßig aktiviert — prüfen Sie mit `ollama show <model>`, ob Ihr Modell es unterstützt
LM Studio	Aktualisieren Sie auf 0.3.6+ und verwenden Sie ein Modell mit nativer Tool-Unterstützung

Antworten werden mitten im Satz abgeschnitten

Zwei Ursachen sind möglich:²

Niedrige Ausgabegrenze (max_tokens) auf dem Server — SGLang verwendet standardmäßig 128 Tokens pro Antwort. Setzen Sie --default-max-tokens auf dem Server oder konfigurieren Sie model.max_tokens in config.yaml.
Erschöpfter Kontext — Das Modell hat sein Kontextfenster gefüllt. Erhöhen Sie model.context_length oder aktivieren Sie die Kontextkomprimierung in Hermes.

“Connection refused” von WSL2 zu einem unter Windows gehosteten Modellserver

WSL2 verwendet einen virtuellen Netzwerkadapter mit eigenem Subnetz — localhost innerhalb von WSL2 verweist auf die Linux-VM, nicht auf den Windows-Host. Es gibt zwei Optionen:²

Gespiegeltes Netzwerk (Windows 11 22H2+): Bearbeiten Sie %USERPROFILE%\.wslconfig:

[wsl2]
networkingMode=mirrored

Führen Sie anschließend wsl --shutdown aus und starten Sie neu. localhost funktioniert nun in beide Richtungen.

Fallback über Host-IP (älteres Windows): Ermitteln Sie innerhalb von WSL2 die Windows-Host-IP und verwenden Sie sie statt localhost:

ip route show | grep -i default | awk '{ print $3 }'
# Use that IP as the base_url host

Außerdem muss der Modellserver an 0.0.0.0 gebunden sein, nicht an 127.0.0.1 — setzen Sie für Ollama OLLAMA_HOST=0.0.0.0, fügen Sie für llama-server/SGLang --host 0.0.0.0 hinzu oder aktivieren Sie in LM Studio “Serve on Network”.²

Wo ist alles?

hermes status und hermes dump sind hier Ihre Freunde. hermes logs list zeigt alle Protokolldateien samt Größe. hermes config path gibt den Speicherort der Konfigurationsdatei aus. hermes config env-path gibt den Speicherort der .env aus.⁶

FAQ

Was ist der Unterschied zwischen Hermes Agent und Claude Code?

Claude Code ist Anthropics offizieller CLI und auf Anthropic-Modelle beschränkt. Hermes Agent ist ein Open-Source-Agent-Framework von Nous Research, das mit jedem OpenAI-kompatiblen Provider funktioniert — Nous Portal, OpenRouter, Anthropic, GitHub Copilot, z.ai, Kimi, MiniMax, DeepSeek, Hugging Face, Google oder Ihrem eigenen selbst gehosteten Endpunkt.¹² Hermes bringt außerdem ein Messaging-gateway für Telegram/Discord/Slack/WhatsApp/Signal mit, das Claude Code nicht hat.

Kann ich Hermes mit einem Anthropic-API-Schlüssel verwenden?

Ja. Es gibt drei Wege:²

Setzen Sie ANTHROPIC_API_KEY in ~/.hermes/.env und führen Sie hermes chat --provider anthropic --model claude-sonnet-4-6 aus
Führen Sie hermes model aus und wählen Sie Anthropic — Hermes verwendet den Anmeldedatenspeicher von Claude Code, sofern verfügbar
Setzen Sie als Fallback manuell ein ANTHROPIC_TOKEN (setup-token oder OAuth-Token)

Option 2 ist vorzuziehen, wenn Sie Claude Code bereits auf demselben Rechner verwenden — so bleiben aktualisierbare Claude-Anmeldedaten aktualisierbar.

Wie wechsle ich den Provider, ohne meine Unterhaltung zu verlieren?

Verwenden Sie innerhalb einer Sitzung /model provider:model. Unterhaltungsverlauf, Speicher und skills bleiben erhalten:⁹

/model zai:glm-5
/model openrouter:anthropic/claude-sonnet-4
/model custom:local:qwen-2.5

Ich habe Anthropic konfiguriert, aber Vision/Web/Komprimierung funktionieren nicht

Sie laufen in den Fallback für das Hilfsmodell. Vision, Web-Zusammenfassungen, Komprimierung und andere Nebenaufgaben verwenden ein separates Hilfs-LLM — standardmäßig Gemini Flash per automatischer Erkennung (OpenRouter → Nous → Codex). Wenn keiner davon konfiguriert ist und Sie nur Anthropic eingerichtet haben, werden diese Funktionen stillschweigend eingeschränkt.⁴

Behebung: Fügen Sie entweder einen OPENROUTER_API_KEY für Hilfsaufgaben hinzu, oder konfigurieren Sie die Hilfs-Slots so um, dass sie Ihren Haupt-Provider verwenden. Beachten Sie, dass die Kontextkomprimierung in einem eigenen Top-Level-Block compression: liegt und summary_provider verwendet, nicht auxiliary.compression.provider — der Slot auxiliary.compression stellt nur ein timeout bereit. Vollständige Behebung:

auxiliary:
  vision:      { provider: "main" }
  web_extract: { provider: "main" }

compression:
  summary_provider: "main"

Worin unterscheiden sich SOUL.md und AGENTS.md?

SOUL.md ist die Identität Ihres Agenten — Ton, Stil und Standardwerte für die Kommunikation. Sie liegt in ~/.hermes/SOUL.md und begleitet Sie überall. AGENTS.md ist projektspezifisch — Architektur, Konventionen, Befehle, Pfade — und liegt in Ihrem Projektverzeichnis.¹³ Wenn es Sie überall begleiten soll: SOUL.md. Wenn es zu einem Projekt gehört: AGENTS.md.

Wie führe ich mehrere Hermes-Instanzen parallel aus?

Mit Profilen. Jedes profile erhält ein eigenes HERMES_HOME, eine eigene Konfiguration, einen eigenen Speicher, eigene Sitzungen und eine eigene gateway-PID:⁶

hermes profile create work --clone
hermes profile use work                 # Sticky default
hermes -p work chat -q "..."            # One-off without switching
hermes profile alias work --name h-work # Wrapper script

Unterstützt Hermes lokale LLMs?

Ja, über den Pfad für benutzerdefinierte Endpunkte. Hermes funktioniert mit jedem OpenAI-kompatiblen Server: Ollama, vLLM, SGLang, llama.cpp/llama-server, LM Studio, LocalAI, Jan oder Ihrem eigenen.² Siehe Benutzerdefinierte und selbst gehostete Endpunkte für die Einrichtung pro Server.

Warum zeigt mein Startbanner weniger Tools an, als der Leitfaden für Hermes angibt?

Der Leitfaden nennt 47 Tools / 20 toolsets aus der Upstream-Architektur-Registry — das ist die Gesamtzahl der Tools, deren Quellcode Hermes über alle toolsets hinweg mitliefert. Ihre laufende Installation zeigt im Banner eine kleinere Zahl an (die für diesen Leitfaden verwendete Referenzinstallation meldet 28 Tools), weil Hermes beim Start nur die Standard-toolsets aktiviert. Viele toolsets sind optional: Messaging-gateway-Adapter, Browserautomatisierung, umfangreichere Scraping-Stacks und mehrere spezialisierte Integrationen müssen ausdrücklich unter toolsets: in ~/.hermes/config.yaml aufgeführt werden, bevor sie geladen werden. Registry-Gesamtzahl = “was verfügbar ist, wenn Sie es aktivieren.” Banner-Gesamtzahl = “was Ihr aktuelles profile tatsächlich geladen hat.” Verwenden Sie hermes tools --list, um zu sehen, welche toolsets aktiv sind und welche verfügbar, aber deaktiviert sind. Einzelne toolsets können Sie zur Laufzeit mit /tools enable <name> und /tools disable <name> umschalten (das Deaktivieren löst einen Sitzungsreset aus, damit der Agent sein Tool-Manifest mit der neuen Struktur neu aufbaut).

Wie geht Hermes mit Modell-Fallback um, wenn mein primärer Provider ausfällt?

Konfigurieren Sie in config.yaml einen fallback_model-Block:²

fallback_model:
  provider: openrouter
  model: anthropic/claude-sonnet-4

Wenn der primäre Provider ausfällt (Ratenlimit, Serverfehler, Authentifizierungsfehler), wechselt Hermes mitten in der Sitzung zum Fallback, ohne den Unterhaltungsverlauf zu verlieren. Das geschieht höchstens einmal pro Sitzung.

Kann der Agent seine eigenen skills mit der Zeit verbessern?

Ja — das ist der „self-improving“-Teil von Hermes Agent. Der Agent kann über das Tool skill_manage skills erstellen, aktualisieren und löschen. Wenn er einen nicht trivialen Workflow erkennt, speichert er den Ansatz als skill für die spätere Wiederverwendung.¹¹ Der Agent erstellt skills nach komplexen Aufgaben (5+ Tool-Aufrufe), wenn Fehler auftreten und er den funktionierenden Weg findet, wenn Sie seinen Ansatz korrigieren oder wenn er einen nicht trivialen Workflow entdeckt.

Gibt es eine IDE-Integration?

Ja — Hermes kann als ACP-Server (Agent Client Protocol) für VS Code, Zed und JetBrains laufen:⁶

pip install -e '.[acp]'
hermes acp

Änderungsprotokoll

Datum	Änderung	Quelle
2026-07-01	Guide v1.10: v0.18.0 “The Judgment Release” (1. Juli 2026, Tag `v2026.7.1`). Abschnitt „Neu in v0.18.0“ hinzugefügt: vollständiger P0/P1-Backlog geschlossen (~692 Einträge); Mixture-of-Agents als First-Class-Funktion mit beschrifteter Ensemble-Ausgabe pro Modell und Live-Streaming; Completion Contracts — `/goal` überprüft die eigene Arbeit durch Ausführen von Projektprüfungen; `/learn` (Workflow beschreiben → wiederverwendbarer skill, CONTRIBUTING.md-konform); `/journey` Memory-/Skill-Zeitachse + Desktop-Memory-Graph; Background-Subagent-Fan-out (gleichzeitig delegierte Aufgaben); Desktop Projects (Projekt/Repo/Lane); Scale-to-zero-gateway mit Drain-Koordination; Google Vertex AI (Gemini über GCP-Servicekonten, automatische OAuth2-Aktualisierung); `/prompt` \$EDITOR-Composer. Quelle: hermes-agent Releases.	²²
2026-06-21	Guide v1.9: v0.17.0 “The Reach Release” (19. Juni 2026, Tag `v2026.6.19`). Abschnitt „Neu in v0.17.0“ hinzugefügt. Messaging: relay-freies iMessage über Photon Spectrum (`hermes photon login`, Device-Code-OAuth), offizieller WhatsApp Business Cloud-API-Adapter (keine Bridge), SimpleX-Gruppen + Anhänge, Raft-Plattform-Plugin. Modelle: `z-ai/glm-5.2` (1M), `anthropic/claude-fable-5`, `laguna-m.1`, `nemotron-3-ultra`, `grok-composer-2.5-fast` (xAI OAuth, 200k); xAI-Standard → `grok-build-0.1`; adaptive Anthropic-Modelle entfernen das Feld `reasoning`. Desktop/Dashboard: Background-Subagents mit Live-Watch-Windows (`delegate_task(background=true)`), vollständiger Profil-Builder, überarbeiteter Skills Hub, Automation Blueprints, sicheres 401-Login, VS Code Marketplace-Themes, japanische + traditionell chinesische UI. Skills/Tools: `image_generate` Image-to-Image-Bearbeitung, `memory` atomarer `operations`-Batch, Skill `simplify-code`, boolesches `write_approval` (ersetzt `write_mode`). Architektur: MCP-Elicitation-Handler, pluggable CronScheduler + Chronos, Managed Scope (`/etc/hermes`), Gateway-Gateway-Relay. Commands: `/version`, `/billing`, `hermes curator run --consolidate` (Opt-in). Sicherheit: Shell-Escape-Denylist-Bypass geschlossen, fail-closed Approval-/Gateway-Adapter, Cron-Umgebung bereinigt, Secrets in Debug-Dumps geschwärzt, MCP-stdio-Exfiltrationsprüfung, urllib3- + PyJWT-CVE-Updates.	²¹
2026-06-08	Guide v1.8: v0.16.0 “The Surface Release” (5. Juni 2026, Tag `v2026.6.5`). Guide auf v0.16 umbenannt und Abschnitt „Neu in v0.16.0“ hinzugefügt. Headline: Hermes ist nicht mehr nur terminalbasiert. Native Hermes Desktop-App (Electron, macOS/Linux/Windows) mit Ein-Klick-Installation, In-App-Self-Update, Streaming-Chat, Drag-and-drop + Einfügen von Bildern aus der Zwischenablage, `Cmd+K`-Palette, Sitzungsarchiv/-suche, Modellauswahl in der Statusleiste, Remote-gateway-Verbindung über sichere WebSocket (OAuth oder Benutzer/Passwort, Hosts pro Profil, profilübergreifende `@session`-Links) und vollständiger Übersetzung ins vereinfachte Chinesisch über typisiertes i18n. Browser-Admin-Panel (Web-Dashboard → vollständige Administration): MCP-Katalog aktivieren/deaktivieren, Zugangsdatenverwaltung, Webhook-/Hook-Erstellung, Memory-Konfiguration, gateway-Steuerung, Systemseite mit Check-before-update + Debug Share, neue Channels-Seite und pluggable Auth (Benutzer/Passwort, selbst gehostetes OIDC, `hermes dashboard register`). Neue Commands: `/undo [N]` (CLI/TUI/Messaging), konfigurierbare Standardschnittstelle (`cli`/`tui`, `--cli`), TUI mit vereinheitlichtem `/model` + Sessions-Overlay, `hermes portal`, `hermes prompt-size`, `hermes sessions optimize`. Neue Modelle: `deepseek-v4-flash`, `MiniMax-M3` (1M Kontext), `qwen3.7-plus`, `gemini-3.5-flash`; First-Class-xAI-Grok-OAuth im Desktop-Launcher; Fuzzy-Modellauswahl; stündliche Katalogaktualisierung. Skills: schlankeres Standardset (Spotify → natives Plugin, Linear → `hermes mcp install linear`, tote Skills entfernt), `environments:`-Relevanz-Gate (`kanban`/`docker`/`s6`), `NVIDIA/skills` als standardmäßig vertrauenswürdiger Tap, progressive (gescopte) MCP-/Plugin-Tool-Offenlegung. Sicherheit: CVE-2026-48710 (Starlette BadHost) auf ≥1.0.1 gepinnt; SSRF-Prüfungen aus dem Event Loop ausgelagert; Bedrock-Bearer-Token aus Subprozess-Env entfernt; `bws_cache.json` mit Leseschutz; `docker restart/stop/kill` zu gefährlichen Mustern hinzugefügt; Bereinigung unsichtbarer Unicode-Zeichen. 2 P0 + 62 P1 geschlossen (16 mit Security-Tag).	²⁰
2026-05-31	Guide v1.7.1: v0.15.1 (29. Mai 2026, 01:12 UTC) — Velocity-Patch. Hotfix am selben Tag nach Velocity; Tag-Zeile `v2026.5.29` gepinnt. Behebt die Dashboard-401-Reload-Schleife, die Deployments im Loopback-Modus betrifft. Docker behandelt `--insecure` nicht mehr implizit — setzen Sie `HERMES_DASHBOARD_INSECURE=1` explizit, um es wieder zu aktivieren. Bare Commands von MCP (`npx`, `npm`, `node`) werden in Docker-Containern wieder korrekt aufgelöst. Source-Pills und Kategorie-Sidebar der Skills-Seite rendern. Kanban-Worker reagieren sauber auf SIGTERM, statt Prozesse verwaisen zu lassen. Skills.sh-Katalog über Sitemap-Erkennung von 858 auf 19.932 Einträge erweitert. 28 Commits, 21 gemergte PRs, 9 Mitwirkende. v0.15.2 (29. Mai 2026, 13:37 UTC) — Velocity-Packaging-Patch. Behebt Wheel- und sdist-Distributionen, sodass `plugin.yaml`-Manifeste gebündelt werden und Installationen von PyPI ohne Sideloading des Source Tree funktionieren. Reiner Packaging-Hotfix, 4 Mitwirkende.	²³
2026-05-28	Guide v1.7: v0.15.0 (28. Mai 2026) — The Velocity release (Tag `v2026.5.28`) hinzugefügt. Headline: massiver Refactoring-Durchlauf + neue Orchestrierungsprimitive. Codebase-Refactoring: `run_agent.py` um 76 % reduziert (16.083 → 3.821 Zeilen), verteilt auf 14 kohärente Module. Multi-agent Kanban v2: automatische Zerlegung von High-Level-Zielen in Teilaufgaben, Swarm-Topologie für parallele Worker-Koordination, Modell-Overrides pro Aufgabe, geplante Aufgaben, Worktree-Management. Performance: zusätzlich eine Sekunde beim Cold Start gespart; 47 % weniger Funktionsaufrufe pro Konversation; `session_search` 4.500× schneller neu gestaltet mit entfernter LLM-Abhängigkeit (und eliminierten API-Kosten). Sicherheit: Promptware-Abwehr schützt an drei Sicherheitskontrollpunkten vor Prompt Injection der Brainworm-Klasse; Bitwarden Secrets Manager-Integration ersetzt mehrere API-Keys pro Provider durch ein einzelnes Bootstrap-Token. Skill-Bundles: mehrere Skills gleichzeitig mit einem Slash Command laden. TUI-Session-Orchestrator: Verwaltung mehrerer Sessions in einem einzigen Terminalfenster. Neue Provider: Krea 2 (Medium/Large) und FAL-Plugin-Unterstützung für Bildgenerierung; xAI-Integrationsrunde ergänzt ein Web-Search-Plugin, OAuth-Upstream, Erkennung ausgemusterter Modelle und natürliche TTS-Pausen. Statistik: 1.302 Commits, 747 gemergte PRs, 321 Community-Mitwirkende. Laut GitHub-Release Notes behebt ein Patch-Release am selben oder folgenden Tag die Dashboard-401-Reload-Schleife, explizite Env-Var für Docker `--insecure`, Bare-Command-Auflösung von MCP in Docker (`npx`, `npm`, `node`), Wiederherstellung der Skills-Seite, SIGTERM-Handling der Kanban-Worker und den vollständigen Skills-Katalog mit 19.932 Einträgen über Sitemap.	²⁴
2026-05-21	Guide v1.6: v0.14.0 (16. Mai 2026) — The Foundation release hinzugefügt. Headline: schlankere Installations-/Runtime-Grundlage plus breitere Provider-, gateway-, Media- und Verifikationsflächen. Hinzugefügt: SuperGrok OAuth mit grok-4.3 1M Kontext, OpenAI-kompatibler `hermes proxy` für OAuth-Provider, First-Class-`x_search`, `pip install hermes-agent`, Lazy Dependency Installs, ~19 s schnellerer Start, 180x schnellere Browser-CDP-Aufrufe, LINE + SimpleX Chat für 22 Messaging-Plattformen, Microsoft Teams end-to-end, `/handoff`, `/subgoal`, native Clarify-Buttons auf Telegram/Discord, Discord-History-Backfill, Raw-Pixel-`vision_analyze`, File-Mutation-Verifier-Footer pro Turn, LSP-Semantikdiagnosen bei jedem Schreibvorgang, vereinheitlichtes `video_generate`, `computer_use` über cua-driver für Nicht-Anthropic-Provider, OSC8-klickbare URLs, Zed ACP Registry-Unterstützung, OpenRouter Pareto Code Router, NovitaAI, Codex App-Server-Runtime, `huggingface/skills` als vertrauenswürdiger Tap, 9 optionale Skills, Plugin `ctx.llm` / `tool_override`, Brave/DDGS-Websuche, Qwen Cloud-Umbenennung, native Windows-Beta und 12 P0-/50 P1-Abschlüsse.	¹⁹
2026-05-07	Guide v1.5: v0.13.0 (7. Mai 2026) — The Tenacity release hinzugefügt. Headline: ein robustes Multi-agent Kanban Board (Heartbeat, Reclaim, Zombie-Erkennung, Halluzinations-Gate, `max_retries` pro Aufgabe, Multi-Projekt-Boards), das Swarms von einem Delegationsmuster zu einem First-Class-Primitiv macht. `/goal` Command fixiert den Agent turnübergreifend auf ein Ziel (Ralph-Loop-Muster als Slash Command). Neues `video_analyze` Tool, Gemini-first mit erweiterbarer Unterstützung kompatibler Modelle. xAI Custom Voices TTS-Provider mit Voice Cloning. 7-sprachiges i18n (zh-Hans, ja, de, es, fr, uk, tr) für CLI und gateway-Nachrichten; Doku nur zh-Hans. Google Chat als 20. Messaging-Plattform über das pluggable Adaptermuster; IRC + Microsoft Teams auf dasselbe Muster migriert. `ProviderProfile` ABC + `plugins/model-providers/` für pluggable Drittanbieter-Provider ohne Core-Änderungen. Automatisches Session-Resume über gateway-Neustart, `/update` und Source-File-Reload hinweg. Checkpoints v2 neu geschrieben mit Single-Store-Design, echtem Pruning und Disk-Guardrails. Acht P0-Sicherheitsabschlüsse: Secret-Redaction standardmäßig aktiv, Discord-Cross-Guild-DM-Bypass (CVSS 8.1), WhatsApp-Stranger-Reject + Self-Chat-Mute, MCP-OAuth-TOCTOU, CLI-`auth.json`-TOCTOU, Browser-SSRF-Floor, Cron-Prompt-Injection-Scanning, `hermes debug share`-Redaction. Post-write-Linting für Python/JSON/YAML/TOML, Cron-`no_agent`-Script-only-Modus, Plattform-Allowlists für Slack/Telegram/Mattermost/Matrix/DingTalk, MCP-Erweiterungen (SSE-Transport, OAuth-Weiterleitung, Image-MEDIA-Tags). Statistik seit v0.12.0: 864 Commits, 588 gemergte PRs, 829 geänderte Dateien, 295 Community-Mitwirkende, 282 geschlossene Issues (13 P0, 36 P1).	¹⁸
2026-05-06	Guide v1.4: v0.12.0 (30. April 2026) — The Curator release hinzugefügt. Headline: ein autonomer Background Curator, der auf dem Cron-Ticker des gateway läuft (7-Tage-Standardzyklus), die Skill-Bibliothek anhand einer Rubrik bewertet, tote Skills entfernt, verwandte Skills konsolidiert und Reports pro Lauf schreibt — Hermes wartet sich zwischen aktiven Sessions selbst. Self-Improvement-Loop mit rubrikbasierter Bewertung, Active-Update-Bias, korrekter Runtime-Vererbung und gescopten toolsets, beschränkt auf Memory und Skills, erweitert. Vier neue Inference-Provider: GMI Cloud, Azure AI Foundry, MiniMax OAuth und Tencent Tokenhub. LM Studio zu First-Class hochgestuft. Remote-Modellkatalog-Manifeste aktualisieren sich jetzt automatisch ohne Releases. Zwei neue Messaging-Plattformen: Microsoft Teams (19., über pluggable gateway-Architektur) und Tencent Yuanbao (18., native Text + Media). Native Spotify über PKCE OAuth mit gebündeltem Skill; Google Meet-Plugin für Calls und Transkription; Piper Local TTS-Provider. ComfyUI v5 + TouchDesigner-MCP von optional zu standardmäßig gebündelt verschoben. Neue Skills: Humanizer, claude-design, design-md, airtable. CLI-Ergänzungen: `hermes -z` One-shot-Modus, `hermes update --check` Preflight, Slash Command `/reload-skills`, pluggable Busy-Indicator-Stile. Sichtbarer TUI-Cold-Start durch Lazy Agent Init und Lazy Imports um ~57 % reduziert. Sicherheit: Secret-Redaction standardmäßig deaktiviert, um Payload-Korruption zu verhindern; harte Blocklist für nicht wiederherstellbare Commands. Statistik: 1.096 Commits, 550 gemergte PRs, 213 Community-Mitwirkende.	¹⁷
2026-04-25	Guide v1.3: v0.11.0 (23. April 2026) — The Interface release hinzugefügt. Vollständiger React/Ink-Rewrite der interaktiven TUI mit Python-JSON-RPC-Backend (`tui_gateway`); Sticky Composer, Live-Streaming mit OSC-52-Clipboard-Unterstützung, stabile Picker-Keys, Statusleiste mit Stoppuhr pro Turn und Git-Branch, `/clear`-Bestätigung, Light-Theme-Preset, Observability-Overlay für Subagent-Spawns. Pluggable Transport Architecture — Formatkonvertierung und HTTP-Transport nach `agent/transports/` extrahiert, für sauberere Provider-Verkabelung. Native AWS Bedrock über die Converse API. Fünf neue Inference-Pfade: NVIDIA NIM, Arcee AI, Step Plan, Google Gemini CLI OAuth und Vercel ai-gateway. GPT-5.5 über Codex OAuth — das neue OpenAI-Flaggschiff ist jetzt über ChatGPT Codex OAuth ohne separaten API-Key erreichbar. QQBot (17. Messaging-Plattform) mit QR-Scan-Einrichtung und Streaming. Plugin-Oberfläche erweitert: Slash Commands, Tool Dispatch, Execution Blocking, Result Transformation. `/steer <prompt>` — Mid-run-Agent-Nudges, die eine Notiz injizieren, die der laufende Agent nach seinem nächsten Tool Call sieht, ohne den Turn zu unterbrechen oder den Prompt Cache zu brechen. Shell Hooks verdrahten Scripts als Lifecycle Hooks ohne Python-Plugins. Webhook Direct-Delivery-Modus leitet Payloads direkt an einen Plattform-Chat weiter und umgeht den Agent für Fan-out. Smartere Delegation mit Orchestrator-Rollen, konfigurierbarer Spawn-Tiefe und Dateikoordination. Dashboard erhält ein Plugin-System, Live-Theme-Wechsel, i18n und mobile Responsiveness. Statistik seit v0.9.0: 1.556 Commits, 761 gemergte PRs, 1.314 geänderte Dateien, 224.174 Einfügungen, 29 Community-Mitwirkende.	²⁵
2026-04-16	Guide v1.2: v0.10.0 — Nous Tool Gateway hinzugefügt. Zahlende Nous Portal-Abonnenten erhalten jetzt Zugriff auf verwaltete Tools (Firecrawl-Websuche, FAL / FLUX 2 Pro-Bildgenerierung, OpenAI TTS, Browser Use-Browserautomatisierung) ohne zusätzliche API-Keys. Opt-in pro Tool über neues Konfigurationsfeld `use_gateway`. Die Runtime bevorzugt gateway gegenüber direkten API-Keys, wenn beides konfiguriert ist. Env-Var `HERMES_ENABLE_NOUS_MANAGED_TOOLS` entfernt. Hermes Agent CLI bleibt MIT-lizenziert und vollständig kostenlos.	²⁶
2026-04-13	Guide v1.1: Funktionen aus v0.8.0 und v0.9.0 hinzugefügt. Lokales Web-Dashboard, `/fast`-Modus, iMessage- + WeChat-Plattformen (insgesamt 16), Background-Prozessüberwachung (`watch_patterns`), pluggable context engine, `hermes backup`/`hermes import`, Termux/Android, xAI- + MiMo- + Google AI Studio- + Qwen-Provider, `/debug` Command, umfassendes Security Hardening.	¹⁵ ¹⁶
2026-04-10	Guide v1.0: Erstveröffentlichung zu Hermes Agent v0.7.0. Provider-Auth, config, CLI, Slash Commands, Tools, Skills, Memory, gateway, cron, MCP, Compression, Architektur, OpenClaw-Migration, Troubleshooting, FAQ.

Referenzen

Nous Research, Projekt-README “Hermes Agent” auf GitHub. Primärquelle für die Produktbeschreibung (selbstverbessernder Agent, mehrere Anbieter, Messaging-gateway, Terminal-Backends, skill-Evolution, cron-Scheduler, Delegation) und den “Quick Install”-Einzeiler. ↩↩↩
Nous Research, “AI Providers” in der Hermes Agent-Dokumentation. Primärquelle für die vollständige Anbieterliste, Auth-Methoden je Anbieter (Nous Portal OAuth, Codex-Gerätecode, GitHub Copilot-Token-Typen, Anthropic-Auth mit drei Methoden, chinesische AI-Anbieter, Hugging Face-Routing, benutzerdefinierte Endpunkte), die drei Auth-Pfade (API-Schlüssel in .env, OAuth über hermes model, benutzerdefinierter Endpunkt in config.yaml), die /model-Slash-Command-Syntax (einschließlich custom:name:model), Ollama/vLLM/SGLang/llama.cpp/LM Studio-Setup-Vorlagen, WSL2-Netzwerkanweisungen, die Kette zur Erkennung der Kontextlänge, die Fallback-Modellkonfiguration, intelligentes Modellrouting und benannte benutzerdefinierte Anbieter. Alle anbieterspezifischen Umgebungsvariablennamen, Token-Typen, Base-URL-Overrides und Modellkennungen in diesem Beitrag stammen von dieser Seite. ↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩
Nous Research, “Architecture” im Hermes Agent-Entwicklerleitfaden. Primärquelle für das Systemübersichtsdiagramm, die Ordnerstruktur, den Datenfluss durch CLI-Session- und Gateway-Nachrichtenpfade, die drei API-Modi (chat_completions, codex_responses, anthropic_messages), Anbieterauflösung über runtime_provider.py, Session-Persistenz über SQLite + FTS5, die Plattformliste des Messaging-gateways, Erkennungsquellen des Plugin-Systems, Profilisolierung und die sechs Designprinzipien. ↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩
Nous Research, “Configuration” im Hermes Agent-Benutzerleitfaden. Primärquelle für die Struktur des Konfigurationsordners, die Regel config.yaml vs. .env (“config.yaml wins for non-secret settings”), die Prioritätskette der Konfiguration (CLI-Argumente → env → config.yaml → .env → Standardwerte), Einstellungen zur Kontextkomprimierung (compression.*-Block mit threshold, target_ratio, protect_last_n, summary_model, summary_provider, summary_base_url), Budgetdruck-Schwellenwerte (70 % Vorsicht, 90 % Warnung), Streaming-Timeouts mit automatischer Anpassung für lokale Anbieter und den vollständigen Konfigurationsblock für Hilfsmodelle (auxiliary: mit vision-, web_extract-, approval-, compression-, session_search-, skills_hub-, mcp-, flush_memories-Slots). Die Beschränkung des "main"-Anbieters auf Auxiliary-/Compression-/Fallback-Slots stammt ebenfalls von dieser Seite. ↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩
Nous Research, “Migrate from OpenClaw” in den Hermes Agent-Leitfäden. Quelle für den OpenClaw → Hermes-Migrationsablauf. ↩↩
Nous Research, “CLI Commands Reference” in der Hermes Agent-Referenzdokumentation. Primärquelle für jeden in diesem Beitrag dokumentierten CLI-Befehl auf oberster Ebene, einschließlich hermes chat, hermes model, hermes gateway, hermes setup, hermes auth, hermes status, hermes cron, hermes webhook, hermes doctor, hermes dump, hermes logs, hermes config, hermes pairing, hermes skills, hermes honcho, hermes memory, hermes acp, hermes mcp, hermes plugins, hermes tools, hermes sessions, hermes insights, hermes claw, hermes profile, hermes completion, hermes update und hermes uninstall. Alle Subcommand-Flags, Optionsbeschreibungen, Verhaltensweisen des Credential-Pools, Syntax zur Logfilterung, OpenClaw-Migrationsflags, Profilverwaltungsbefehle und Dienstinstallationsbefehle in diesem Beitrag stammen von dieser Seite. ↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩
Nous Research, “Installation” im Hermes Agent-Getting-Started-Leitfaden. Primärquelle für den Einzeiler-Installationsbefehl, das Verhalten des Installers (Voraussetzungen, Plattformunterstützung, automatische Termux-Erkennung, Windows-/WSL2-Anforderungen), die Tabelle optionaler Extras, die manuellen Installationsschritte und die Verifizierungsbefehle. ↩↩↩↩↩↩↩
Nous Research, “CLI Commands Reference” — siehe insbesondere den Abschnitt hermes dump, der das Ausgabeformat des Befehls (Header, Umgebung, Identität, Modell, Terminal, API-Schlüssel, Funktionen, Dienste, Workload, Konfigurationsüberschreibungen) und die vorgesehene Nutzung zum Teilen von Diagnosedaten beschreibt. ↩
Nous Research, “Slash Commands Reference” in der Hermes Agent-Referenzdokumentation. Primärquelle für jeden in diesem Beitrag aufgeführten Slash-Command, die COMMAND_REGISTRY-Architektur, die Trennung zwischen CLI und Messaging, dynamische skill-Slash-Commands, Schnellbefehle in config.yaml, das Prefix-Matching-Verhalten und die nur für Messaging verfügbaren Befehle (/status, /sethome, /approve, /deny, /update, /commands). ↩↩↩↩↩↩↩↩↩↩
Nous Research, “Tools & Toolsets” im Hermes Agent-Benutzerleitfaden. Primärquelle für die Übersicht der Tool-Kategorien, Befehle zur toolset-Nutzung, die sechs Terminal-Backends (local, docker, ssh, singularity, modal, daytona), Containerkonfiguration (cpu, memory, disk, persistent), Security-Härtung für Container, Hintergrundprozessverwaltung API und sudo-Unterstützung. ↩↩↩↩↩↩↩↩↩↩
Nous Research, “Skills System” im Hermes Agent-Benutzerleitfaden. Primärquelle für Progressive Disclosure, das SKILL.md-Format, plattformspezifische skills, bedingte Aktivierung (fallback_for_toolsets, requires_toolsets, fallback_for_tools, requires_tools), agent-verwaltete skills über skill_manage, die skill-hub-Befehle und Quellenliste (official, skills-sh, well-known, github, clawhub, claude-marketplace, lobehub), Security-Scanning und Vertrauensstufen sowie externe skill-Ordner. ↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩
Nous Research, “Persistent Memory” im Hermes Agent-Benutzerleitfaden. Primärquelle für die Zeichenlimits von MEMORY.md / USER.md, das Frozen-Snapshot-Muster, Memory-Tool-Aktionen (add, replace, remove), was gespeichert bzw. übersprungen werden sollte, den Vergleich zwischen Memory und Session-Suche sowie die Liste von acht externen Memory-Anbietern (Honcho, OpenViking, Mem0, Hindsight, Holographic, RetainDB, ByteRover, Supermemory). ↩↩↩↩↩↩↩↩
Nous Research, “Personality & SOUL.md” im Hermes Agent-Benutzerleitfaden. Primärquelle für das Verhalten von SOUL.md (liegt in HERMES_HOME, wird nie überschrieben, Slot Nr. 1 im System-Prompt, wird vor Einbindung auf Security geprüft), die Unterscheidung zwischen SOUL.md und AGENTS.md, die integrierte Persönlichkeitsliste (14 Persönlichkeiten von helpful bis hype), benutzerdefinierte Persönlichkeiten in config.yaml, das /personality-Overlay-Muster und die vollständige Reihenfolge beim Aufbau des Prompt-Stacks. ↩↩↩↩↩↩↩↩↩↩↩↩
Nous Research, “Use MCP with Hermes” und MCP Config Reference in den Hermes Agent-Leitfäden und der Referenz. Quelle für das mcp_servers:-Konfigurationsformat in config.yaml mit den Feldern command, args, env. ↩
Hermes Agent v0.8.0 Release Notes. 8. April 2026. Automatische Benachrichtigungen für Hintergrundprozesse, kostenloses MiMo v2 Pro auf Nous Portal, Live-/model-Wechsel über Plattformen hinweg, nativer Google AI Studio-Anbieter, Qwen OAuth, inaktivitätsbasierte Timeouts, Freigabeschaltflächen auf Slack/Telegram, MCP OAuth 2.1 PKCE, zentrales Logging, Erweiterung des Plugin-Systems. ↩↩↩↩↩
Hermes Agent v0.9.0 Release Notes. 13. April 2026. Lokales Web-Dashboard, Fast Mode (/fast), iMessage über BlueBubbles, WeChat + WeCom, Termux/Android, Überwachung von Hintergrundprozessen (watch_patterns), native Anbieter xAI + Xiaomi MiMo, austauschbare context engine, einheitliche Proxy-Unterstützung, Security-Härtung (Fixes für Path Traversal, Shell Injection, SSRF, RCE), hermes backup/hermes import, /debug + hermes debug share, 16 unterstützte Plattformen. 487 Commits, 269 gemergte PRs, 24 Mitwirkende. ↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩
Hermes Agent v0.12.0 Release Notes. 30. April 2026. „The Curator release.“ Autonomer Hintergrund-Curator, der die skill-Bibliothek in einem standardmäßigen 7-Tage-Zyklus auf dem cron-Ticker des gateways bewertet, bereinigt und konsolidiert. Self-Improvement-Loop aktualisiert: rubrikbasierte Bewertung, Active-Update-Bias, korrekte Runtime-Vererbung, scoped toolsets beschränkt auf Memory und skills. Vier neue Inferenzanbieter: GMI Cloud, Azure AI Foundry, MiniMax OAuth, Tencent Tokenhub. LM Studio zum First-Class-Anbieter hochgestuft. Remote-Modellkatalog-Manifeste aktualisieren sich automatisch ohne Releases. Zwei neue Messaging-Plattformen: Microsoft Teams (19., über austauschbare Gateway-Architektur) und Tencent Yuanbao (18., nativer Text + Medien). Natives Spotify über PKCE OAuth mit gebündeltem skill; Google Meet-Plugin für Anrufe und Transkription; lokaler Piper-TTS-Anbieter. ComfyUI v5 + TouchDesigner-MCP standardmäßig gebündelt. Neue skills: Humanizer, claude-design, design-md, airtable. CLI: hermes -z-One-Shot-Modus, hermes update --check-Preflight, /reload-skills-Slash-Command, austauschbare Busy-Indicator-Stile. TUI-Kaltstart durch Lazy Initialization um ca. 57 % verkürzt. Security: Secret-Redaction standardmäßig deaktiviert; harte Blocklist für nicht wiederherstellbare Befehle. Statistiken seit v0.11.0: 1.096 Commits, 550 gemergte PRs, 213 Community-Mitwirkende. Siehe auch: Release-Tag v2026.4.30. ↩↩↩
Hermes Agent v0.13.0 Release Notes. 7. Mai 2026. „The Tenacity release.“ Multi-Agent-Kanban-Board mit Heartbeat, Reclaim, Zombie-Erkennung, Hallucination Gate, max_retries je Aufgabe, Multi-Projekt-Boards. /goal-Slash-Command für turn-übergreifende Zielverriegelung (Ralph-Loop-Primitiv) mit konfigurierbarem Turn-Budget. video_analyze-Tool, Gemini-first mit kompatibler multimodaler Erweiterbarkeit. xAI Custom Voices-TTS-Anbieter mit Voice Cloning. 7-sprachige i18n: zh-Hans, ja, de, es, fr, uk, tr (CLI + Gateway-Nachrichten; Dokumentation nur zh-Hans). Google Chat als 20. Messaging-Plattform über austauschbares Adaptermuster mit generischen env_enablement_fn / cron_deliver_env_var-Plugin-Hooks; IRC und Microsoft Teams auf dasselbe Muster migriert. ProviderProfile ABC + plugins/model-providers/ für austauschbare Drittanbieter. Automatische Session-Wiederaufnahme über Gateway-Neustart, /update und Neuladen von Quelldateien hinweg. Checkpoints v2 als Single-Store-Neufassung mit echtem Pruning, Disk-Guardrails, keine verwaisten Shadow-Repos. Acht P0-Security-Abschlüsse: Secret-Redaction standardmäßig aktiv, Discord-Cross-Guild-DM-Bypass (CVSS 8.1, rollenbasierte Allowlists guild-scoped), WhatsApp weist Fremde standardmäßig ab + nie in Self-Chat antworten, MCP OAuth Credential-Save-TOCTOU, CLI auth.json-TOCTOU in Credential-Writern, Browser-Cloud-Metadata-SSRF-Untergrenze im Hybrid-Routing, cron-Scanning zusammengesetzter Prompts (einschließlich skill-Inhalt) auf Prompt Injection, hermes debug share-Log-Content-Redaction beim Upload. Weitere nennenswerte Punkte: Post-Write-Linting für Python/JSON/YAML/TOML, cron-no_agent-Nur-Skript-Watchdog-Modus, Plattform-Allowlists über Slack/Telegram/Mattermost/Matrix/DingTalk hinweg, MCP-Verbesserungen (SSE-Transport, OAuth-Weiterleitung, Bildergebnisse als MEDIA-Tags). Statistiken seit v0.12.0: 864 Commits, 588 gemergte PRs, 829 geänderte Dateien, 295 Community-Mitwirkende, 282 geschlossene Issues (13 P0, 36 P1). ↩↩↩↩↩↩↩↩↩↩↩↩
Hermes Agent v0.14.0 Release Notes. 16. Mai 2026. „The Foundation release.“ Seit v0.13.0: 808 Commits, 633 gemergte PRs, 1.393 geänderte Dateien, 165.061 Einfügungen, 545 geschlossene Issues (12 P0, 50 P1) und 215 Community-Mitwirkende. Ergänzt SuperGrok OAuth mit grok-4.3 1M-Kontext, hermes proxy, x_search, PyPI-Paketierung, Lazy Dependencies, 1h-Claude-Prompt-Cache über Sessions hinweg, ca. 19 s schnellerer Start, 180x schnellere Browser-CDP-Aufrufe, LINE und SimpleX Chat für 22 Messaging-Plattformen, /handoff, native Clarify-Buttons, Discord-History-Backfill, Raw-Pixel-vision_analyze, File-Mutation-Verifier-Footer je Turn, semantische LSP-Diagnosen, einheitliches video_generate, cua-driver computer_use, OSC8-Links, Zed ACP Registry-Unterstützung, OpenRouter Pareto Code Router, NovitaAI, Codex-App-Server-Runtime, huggingface/skills, Plugin-ctx.llm, tool_override, Brave/DDGS-Suche, Härtung gefährlicher Befehle, /subgoal, Qwen Cloud-Umbenennung, native Windows-Beta, insgesamt 16 Locales und breite Dokumentations-/Testaktualisierungen. ↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩
Hermes Agent v0.16.0 release notes, „The Surface Release“, Tag v2026.6.5, veröffentlicht am 2026-06-06T00:55:58Z (Release-Tag-Datum 5. Juni 2026); neuester Stand am 2026-06-08. Neuer nativer Hermes Desktop (Electron, macOS/Linux/Windows; Remote-Gateway-Verbindung über sicheres WebSocket mit OAuth oder Benutzer/Passwort; Remote-Hosts je Profil; profilübergreifende @session-Links; vereinfachte chinesische UI über typisierte i18n, display.language). Web-Dashboard zu einem vollständigen Admin-Panel erweitert (MCP-Katalog-Toggles, Credential-Verwaltung, Webhook-/Hook-Erstellung, Memory-Konfiguration, Gateway-Steuerung, System-Seite mit Check-before-update + Debug Share, Channels-Seite; austauschbare Auth einschließlich selbst gehostetem OIDC und hermes dashboard register). Neue Befehle: /undo [N], konfigurierbare Standardschnittstelle (cli/tui, --cli), TUI-/model + Sessions-Overlay, hermes portal, hermes prompt-size, hermes sessions optimize. Neue Modelle: deepseek-v4-flash, MiniMax-M3 (1M-Kontext), qwen3.7-plus, gemini-3.5-flash; xAI Grok OAuth; Fuzzy Picker; stündliche Katalogaktualisierung. Skills: schlankeres Standardset, Relevanz-Gate environments:, NVIDIA/skills als standardmäßig vertrauenswürdiger Tap, Progressive Tool Disclosure, Fix für MCP false-OAuth-success. Security: CVE-2026-48710 (Starlette BadHost) auf ≥1.0.1 gepinnt, SSRF-Prüfungen außerhalb des Event-Loops, Bedrock-Bearer-Token aus Subprozess-env entfernt, bws_cache.json mit Leseschutz, docker restart/stop/kill als zusätzliche Dangerous-Patterns, Bereinigung unsichtbarer Unicode-Zeichen; 2 P0 + 62 P1 geschlossen (16 mit Security-Tag). Release-Note-Marketingrahmung (PR-/Commit-Zahlen, „none of this existed a week ago“) ausgeschlossen; erfasst sind nur konkrete Funktions-/Versionsfakten, die an den Tag gebunden sind. Verifizierung in der aktuellen Session am 8. Juni 2026. ↩↩↩↩↩↩↩↩
Hermes Agent v0.17.0 release notes, „The Reach Release“, Tag v2026.6.19, 19. Juni 2026; neuester Stand am 2026-06-21. Messaging: iMessage über Photon Spectrum (Gerätecode-OAuth, hermes photon login, kein Mac-Relay); offizieller WhatsApp Business Cloud-API-Adapter (ersetzt Bridge-Prozess); SimpleX-Gruppen, native Anhänge, Text-Batching, Auto-Accept; Raft als gebündeltes Plattform-Plugin. Modelle/Anbieter: z-ai/glm-5.2 (1M-Kontext), anthropic/claude-fable-5, laguna-m.1, nemotron-3-ultra, grok-composer-2.5-fast (xAI OAuth, 200k-Kontext); xAI-Standard → grok-build-0.1; adaptive Anthropic-Modelle verwenden den modernen Thinking-Contract (kein reasoning-Feld). CLI/Slash: /version, /billing, hermes photon login, hermes curator run --consolidate (Opt-in), hermes model GUI, Profilklonen. Desktop: Hintergrund-Subagent-Watch-Windows (delegate_task(background=true)), Composer-Modellauswahl, neu bindbare Shortcuts, native OS-Benachrichtigungen, Entwürfe je Thread, VS Code Marketplace-Themes, japanische + traditionelle chinesische UI. Dashboard: vollständiger Profil-Builder, globaler Profilwechsler, Skills Hub-Überarbeitung mit Security-Scan, Automation Blueprints, sicherer Login (401 hinter OAuth). Skills/Tools: image_generate-Image-to-Image-Bearbeitung über Anbieter hinweg, atomarer Batch für memory-operations, Parallel-Review-skill simplify-code, boolesches write_approval ersetzt write_mode. Architektur: Hintergrund-Subagents (Handle wird sofort zurückgegeben, Ergebnis tritt als Turn wieder ein), MCP-Elicitation-Handler für Bestätigung mitten in Tool-Calls, spät verbindende MCP-Tools zwischen Turns verfügbar, austauschbarer CronScheduler + Chronos Managed-Cron, Managed Scope (/etc/hermes admin-gepinnt), Gateway-Gateway-Relay. Security: Shell-Escape-Denylist-Bypass geschlossen, Fail-Closed bei fehlendem Approval-Modul und eigenen Policy-Gateway-Adaptern, cron-Job-Skript-env bereinigt, Secrets in Debug-Dumps redigiert, Host-Metadaten aus öffentlichem Status entfernt, MCP-stdio-Exfil-Pattern-Screening, urllib3- + PyJWT-CVE-Bumps. Release-Marketingrahmung (Commit-/PR-Zahlen) ausgeschlossen. Verifizierung in der aktuellen Session am 21. Juni 2026. ↩↩↩↩↩↩↩↩↩↩↩
Hermes Agent v0.18.0 release notes (Tag v2026.7.1), 1. Juli 2026 — „The Judgment Release.“ Prioritäts-Backlog-Sweep (alle P0/P1 geschlossen, ca. 692 Elemente in zwölf Tagen); Mixture-of-Agents als First-Class-Modell über alle Schnittstellen auswählbar, wobei die vollständige Ausgabe jedes Referenzmodells als eigener beschrifteter Block gerendert wird und die Live-Antwort streamt; Completion Contracts für /goal (Agent verifiziert die eigene Arbeit durch Ausführen von Projektprüfungen); /learn-Befehl (wandelt alles durch Beschreibung in einen wiederverwendbaren skill um, mit automatischer CONTRIBUTING.md-Compliance); /journey als visuelle Memory-/skill-Zeitleiste mit Bearbeitung und Desktop-Memory-Graph; Hintergrund-Subagent-Fan-out (mehrere gleichzeitig delegierte Aufgaben); Desktop Projects (Projekt-/Repo-/Lane-Modell); Scale-to-zero-gateway mit Drain-Koordination; Google Vertex AI-Unterstützung (Gemini über GCP-Servicekonten, automatische OAuth2-Token-Aktualisierung); /prompt $EDITOR-Befehl. Verifizierung in der aktuellen Session am 1. Juli 2026 (PST) gegen die GitHub-Releases-Seite; v0.18.0 ist das neueste Release. ↩↩↩↩↩↩↩↩↩↩↩
Hermes Agent v0.15.1 release notes und Hermes Agent v0.15.2 release notes. v0.15.1 (29. Mai 2026, 01:12 UTC) ist der Velocity-Hotfix vom selben Tag: Fix für Dashboard-401-Reload-Loop im Loopback-Modus; Docker erfordert jetzt explizit HERMES_DASHBOARD_INSECURE=1; MCP-Bare-Commands (npx, npm, node) werden in Docker-Containern aufgelöst; Quellen-Pills + Kategorie-Seitenleiste der Skills-Seite wiederhergestellt; Kanban-Worker reagieren auf SIGTERM; Skills.sh-Katalog über Sitemap von 858 auf 19.932 Einträge gewachsen. 28 Commits, 21 gemergte PRs, 9 Mitwirkende. v0.15.2 (29. Mai 2026, 13:37 UTC) ist ein reiner Packaging-Hotfix, der plugin.yaml-Manifeste in Wheel- und sdist-Distributionen bündelt, sodass PyPI-Installationen ohne Sideloading des Quellcodes funktionieren. 4 Mitwirkende. ↩
Hermes Agent v0.15.0 release notes und die Hermes Agent-Releases-Seite. „The Velocity release“, Tag v2026.5.28. Statistiken: 1.302 Commits, 747 gemergte PRs, 321 Community-Mitwirkende. Refaktoriert run_agent.py zu 76 % (16.083 → 3.821 Zeilen über 14 Module). Ergänzt die Multi-Agent-Kanban-Plattform (Auto-Decomposition, Swarm-Topologie, Modell-Overrides je Aufgabe, geplante Aufgaben, Worktree-Verwaltung). session_search neu gestaltet, 4.500× schneller und ohne LLM-Abhängigkeit. Promptware-Abwehr gegen Prompt Injection der Brainworm-Klasse an drei Security-Chokepoints. Bitwarden Secrets Manager-Integration ersetzt mehrere API-Schlüssel je Anbieter durch ein einzelnes Bootstrap-Token. skill-Bundles laden mehrere skills mit einem Slash-Command. TUI-Session-Orchestrator für Multi-Session-Verwaltung in einem Terminalfenster. Krea 2 (Medium/Large) und FAL-Plugin-Unterstützung für Bilderzeugung. xAI-Integrationsrunde ergänzt Websuche-Plugin, OAuth upstream, Erkennung ausgemusterter Modelle und natürliche TTS-Pausen in der Sprachausgabe. Ein auf GitHub referenziertes Patch-Release behebt Dashboard-401-Reload-Loop, Docker --insecure mit erforderlicher expliziter Env-Var HERMES_DASHBOARD_INSECURE=1, MCP-Bare-Command-Auflösung (npx, npm, node) in Docker, Rendering der Skills-Seite, Kanban-Worker-SIGTERM-Handling, vollständigen Skills-Katalog mit 19.932 Einträgen über Sitemap sowie eine kleine Gruppe von .md-Auslieferung, Gateway-Probe-Sicherheit, Web-URL-Redaction, Vision-Fähigkeit für Kanban-Worker und Hindsight-Observation-Standards. ↩
Hermes Agent v0.11.0 Release Notes. 23. April 2026. „The Interface release“ — vollständige React/Ink-Neufassung der interaktiven CLI mit einem Python JSON-RPC-Backend (tui_gateway); austauschbare Transportarchitektur (agent/transports/); natives AWS Bedrock über Converse API; fünf neue Inferenzpfade (NVIDIA NIM, Arcee AI, Step Plan, Google Gemini CLI OAuth, Vercel ai-gateway); GPT-5.5 über Codex OAuth; QQBot als 17. Messaging-Plattform mit QR-Scan-Setup; erweiterte Plugin-Oberfläche (Slash-Commands, Tool-Dispatch, Execution Blocking, Result Transformation); /steer <prompt> für Agent-Nudges mitten im Lauf, die nach dem nächsten Tool-Call Kontext injizieren, ohne den Prompt-Cache zu brechen; Shell-Hooks für Lifecycle-Events ohne Python-Plugins; Webhook-Direct-Delivery-Modus, der Payloads direkt an einen Plattform-Chat weiterleitet; intelligentere Delegation mit Orchestrator-Rollen + konfigurierbarer Spawn-Tiefe + Dateikoordination; Dashboard-Plugin-System, Live-Theme-Wechsel, i18n, mobile Responsiveness. Statistiken seit v0.9.0: 1.556 Commits · 761 gemergte PRs · 1.314 geänderte Dateien · 224.174 Einfügungen · 29 Community-Mitwirkende. Siehe auch: Hermes Agent v0.11.0 GitHub release tag. ↩↩↩
Hermes Agent v0.10.0 Release Notes. 16. April 2026. „The Tool Gateway Release.“ Nous Tool Gateway-Integration für zahlende Nous Portal-Abonnenten — verwalteter Zugriff auf Firecrawl-Websuche, FAL / FLUX 2 Pro-Bilderzeugung, OpenAI TTS und Browser Use-Browserautomatisierung ohne zusätzliche API-Schlüssel. Opt-in je Tool über das neue Konfigurationsfeld use_gateway. Zur Laufzeit wird gateway gegenüber direkten API-Schlüsseln bevorzugt, wenn beides konfiguriert ist. Vollständige Integration mit hermes tools und hermes status. Ersetzt die veraltete Env-Var HERMES_ENABLE_NOUS_MANAGED_TOOLS. Implementierung von @jquesnelle (emozilla). Hermes Agent CLI bleibt MIT-lizenziert und vollständig Open Source; das gateway ist eine Integration mit dem bestehenden Portal-Abonnementprodukt, keine Paywall für die CLI. Siehe auch: Nous Portal für Abonnementpreise und Registrierung. ↩↩↩