How do I sign into a different AI provider in Hermes Agent?

Hermes has three auth paths. Path 1: API key in ~/.hermes/.env for providers like OpenRouter, z.ai, Kimi, MiniMax, DeepSeek, Hugging Face, and Google. Path 2: OAuth via hermes model or hermes auth for Nous Portal, OpenAI Codex, GitHub Copilot, and Anthropic — credentials are stored in ~/.hermes/auth.json. Path 3: custom endpoint in config.yaml for any OpenAI-compatible server like Ollama, vLLM, SGLang, llama.cpp, or LM Studio. Run hermes model interactively to walk through all options.

Can I run Hermes Agent with a local LLM like Ollama or vLLM?

Yes. Hermes works with any OpenAI-compatible API endpoint — Ollama, vLLM, SGLang, llama.cpp, LM Studio, LocalAI, Jan, or your own server. Run hermes model, select Custom endpoint, enter the base URL (e.g., http://localhost:11434/v1 for Ollama) and model name. Hermes handles context length detection automatically, but watch out for low defaults on Ollama (4k) and LM Studio (2048) — raise to at least 16k-32k for agent use.

What is SOUL.md and how does it relate to AGENTS.md?

SOUL.md is the agent's primary identity — tone, voice, communication style, personality-level behavior. It lives at ~/.hermes/SOUL.md and occupies slot #1 in every system prompt. AGENTS.md is project-specific — architecture, conventions, commands, paths — and lives in your project directory. The rule: if it should follow you everywhere, it belongs in SOUL.md. If it belongs to a project, it belongs in AGENTS.md.

hermes@agent:~/.hermes$ cat hermes.md

██╗  ██╗███████╗██████╗ ███╗   ███╗███████╗███████╗       █████╗  ██████╗ ███████╗███╗   ██╗████████╗
██║  ██║██╔════╝██╔══██╗████╗ ████║██╔════╝██╔════╝      ██╔══██╗██╔════╝ ██╔════╝████╗  ██║╚══██╔══╝
███████║█████╗  ██████╔╝██╔████╔██║█████╗  ███████╗█████╗███████║██║  ███╗█████╗  ██╔██╗ ██║   ██║
██╔══██║██╔══╝  ██╔══██╗██║╚██╔╝██║██╔══╝  ╚════██║╚════╝██╔══██║██║   ██║██╔══╝  ██║╚██╗██║   ██║
██║  ██║███████╗██║  ██║██║ ╚═╝ ██║███████╗███████║      ██║  ██║╚██████╔╝███████╗██║ ╚████║   ██║
╚═╝  ╚═╝╚══════╝╚═╝  ╚═╝╚═╝     ╚═╝╚══════╝╚══════╝      ╚═╝  ╚═╝ ╚═════╝ ╚══════╝╚═╝  ╚═══╝   ╚═╝

Hermes Agent：实践者参考（2026）

Q: What is Hermes Agent and how is it different from Claude Code?

Hermes Agent is an open-source self-improving AI agent from Nous Research. Unlike Claude Code which is locked to Anthropic models, Hermes works with any OpenAI-compatible provider — Nous Portal, OpenRouter, Anthropic, GitHub Copilot, z.ai, Kimi, MiniMax, DeepSeek, Hugging Face, Google, or your own self-hosted endpoint. Hermes also ships a messaging gateway for Telegram, Discord, Slack, WhatsApp, Signal, and more that Claude Code does not have.

Q: How do I switch models mid-conversation without losing history?

Use /model provider:model inside an active session. Hermes persists the conversation, memory, and skills across the switch. Examples: /model zai:glm-5, /model openrouter:anthropic/claude-sonnet-4, /model custom:local:qwen-2.5 for a named custom provider. /model custom with no model name auto-detects the model from a local endpoint's /v1/models API.

# Hermes Agent实践者参考，介绍Nous Research推出的开源自我改进AI agent：提供商认证与OAuth、配置文件、技能系统，以及如何将其作为多平台消息网关运行。

words: 4091 read_time: 52m updated: 2026-07-02 14:23

$ less hermes.md

TL;DR：Hermes Agent是Nous Research推出的开源自我改进型AI Agent。它既可作为CLI运行，也可作为多平台消息gateway运行；它会在磁盘上存储持久身份和持久记忆，聚合会随使用而改进的skill，并可配合任何兼容OpenAI的LLM提供商使用——Nous Portal、OpenRouter、Anthropic、GitHub Copilot、z.ai、Kimi、MiniMax、DeepSeek、Qwen Cloud、Hugging Face、Google、xAI/SuperGrok，或您自托管的endpoint。¹²¹⁹截至v0.14.0（2026年5月16日），Hermes新增了支持grok-4.3 1M上下文的SuperGrok OAuth、面向OAuth提供商的兼容OpenAI的本地代理（hermes proxy）、一等支持的x_search、PyPI安装支持、lazy依赖安装、包含LINE和SimpleX Chat在内的22个消息平台、/handoff、写入后的LSP语义诊断、统一的video_generate、通过cua-driver为非Anthropic提供商提供的computer_use、原生Windows beta，以及12个P0/50个P1问题闭环。¹⁹对大多数新用户来说，最难的部分是提供商认证：Hermes支持约20个一等提供商以及custom endpoints，并提供3条不同的认证路径（.env中的API密钥、通过hermes model进行OAuth，或在config.yaml中配置custom endpoint）。认证模型是首先要掌握的内容——其他一切都取决于最终解析到哪个提供商。

Hermes Agent作为完整的Agent运行时运行，而不是聊天封装器。它可以读取您的文件系统，在沙盒后端中执行命令，抓取网页，生成subagents，运行计划cron任务，通过单个gateway进程与Telegram/Discord/Slack/WhatsApp/Signal/Email通信，并从经验中创建自己的skills。¹CLI是构建在run_agent.py会话循环之上的终端UI；gateway则是一个长时间运行的进程，会将消息平台中的消息路由到同一个会话循环。³

随意使用和专家级使用Hermes的差异，归根结底在于5个系统。掌握它们，Hermes就会成为效能倍增器：

提供商解析：认证流程如何映射到API调用
配置层级：config.yaml+.env+auth.json+SOUL.md+AGENTS.md
工具+toolset系统：Agent能做什么，并按平台加以限制
Skills系统：Agent创建并演进的过程性记忆
Gateway+cron+profiles：让Hermes在您的日常工作场景中运行，而不只是在当前位置运行

关键要点

提供商认证有3条路径，而不是1条。.env中的API密钥、通过hermes model/hermes auth进行OAuth，或在config.yaml中配置custom endpoint。请选择与提供商匹配的路径，而不是看起来熟悉的路径。
切换提供商只需一条命令。hermes model会以交互方式引导您完成所有受支持的提供商配置，包括OAuth登录；/model provider:model可在会话中途切换模型，且不会丢失历史记录。²
用户可编辑的配置界面主要是两个文件。~/.hermes/config.yaml保存设置，~/.hermes/.env保存密钥。auth.json、SOUL.md、MEMORY.md和skills/由Hermes直接管理——您可以手动编辑SOUL.md，但其余内容由Agent自行维护。⁴
Hermes是OpenClaw的继任者。如果正在迁移，hermes claw migrate会自动导入30多个类别的状态。⁵
服务质量取决于您的辅助模型。视觉、网页摘要、压缩和记忆刷新都会使用单独的辅助LLM。默认情况下，它会通过自动检测使用Gemini Flash（OpenRouter→Nous→Codex）——如果这些都未配置，相关功能会静默降级，直到您将辅助槽位指向主提供商。⁴

v0.14带来了哪些变化

v0.14.0并非只围绕一个头条功能，而是重点降低设置阻力，同时拓宽Hermes的运行范围。¹⁹主要的操作层面变化如下：

安装和启动更轻量。pip install hermes-agent可从PyPI安装，重型适配器会在首次使用时lazy安装，启动路径也延后了足够多的工作，使冷启动时间大约减少19秒。
订阅可以变成本地APIendpoint。hermes proxy会把OAuth支持的提供商（例如Claude Pro、ChatGPT Pro和SuperGrok）转换为兼容OpenAI的本地endpoint，供Codex、Aider、Cline和Continue等工具使用。
Gateway覆盖范围扩大。LINE和SimpleX Chat将平台总数提升到22个；Microsoft Teams已实现端到端接入；Discord历史回填默认开启；Telegram/Discord的clarify提示现在使用原生按钮。
写入时验证得到改进。编辑后，Hermes可以在下一轮之前显示每轮文件变更摘要和语言服务器语义诊断，使其更接近以证据驱动的Agent工作方式。
桌面和媒体工具范围更广。computer_use通过cua-driver支持非Anthropic提供商，video_generate统一到可插拔后端之后，vision_analyze会把原始像素发送给真正具备视觉能力的模型。

以下每一节都基于上游文档hermes-agent.nousresearch.com/docs和源代码树github.com/NousResearch/hermes-agent。每项事实性陈述都有脚注，指向其来源的具体上游页面。

选择您的路径

您需要什么	前往这里
安装Hermes	安装——一行安装器或手动步骤
登录提供商	认证与提供商——您来到这里要找的部分
在会话中途切换模型	命令`hermes auth`和Custom & Self-Hosted Endpoints，查看`/model`语法
运行本地LLM	Custom & Self-Hosted Endpoints——Ollama、vLLM、SGLang、llama.cpp、LM Studio
连接消息平台	Messaging Gateway——Telegram、Discord、Slack、WhatsApp、Signal、Google Chat、LINE、SimpleX Chat（共22个）
编写或安装skill	Skills System——渐进式披露+skill hub
查看每个CLI命令的深入参考	继续阅读，并直接链接到CLI Commands

Hermes 的工作方式：心智模型

Hermes 围绕一个单一的对话循环构建，任何入口点都可以调用它。这些入口点包括 CLI（cli.py）、消息 gateway（gateway/run.py）、用于编辑器集成的 ACP 适配器、批处理运行器，以及一个 API 服务器。³ 它们最终都会调用 run_agent.py 中的 AIAgent.run_conversation()，该方法会：

通过 prompt_builder.py 从 SOUL.md、MEMORY.md、USER.md、skill、上下文文件和工具指导构建系统提示词³
通过 runtime_provider.py 解析运行时 provider——这一步会选择身份验证、base URL 和 API 模式³
使用以下3种 API 模式之一调用 provider：chat_completions、codex_responses 或 anthropic_messages³
通过 model_tools.py 和中央工具注册表（tools/registry.py）分派任何返回的工具调用³
循环执行，直到模型生成最终响应，然后使用 FTS5 将会话持久化到 SQLite³

理解这个循环很重要，因为每项功能——personality、memory、skill、compression、fallback——都会挂接到其中某个阶段。当您阅读某个配置键并想知道它有什么作用时，答案通常是：“它是上述循环第1、2、3或4阶段上的一个旋钮。”

与平台无关的核心。 一个 AIAgent 类服务于 CLI、gateway、ACP、batch 和 API 服务器。平台差异存在于入口点，而不是 agent 本身。³ 这就是为什么相同的 slash command 可以在终端和 Telegram 中工作——它们都从 hermes_cli/commands.py 中共享的 COMMAND_REGISTRY 分派。⁶

目录结构就是系统。 Hermes 会将所有内容存储在 ~/.hermes/ 下（非默认 profile 则使用 $HERMES_HOME）：⁴

~/.hermes/
├── config.yaml        # Settings (model, terminal, TTS, compression, etc.)
├── .env               # API keys and secrets
├── auth.json          # OAuth provider credentials (Nous Portal, Codex, Anthropic)
├── SOUL.md            # Primary agent identity (slot #1 in system prompt)
├── memories/          # Persistent memory (MEMORY.md, USER.md)
├── skills/            # Bundled + agent-created + hub-installed skills
├── cron/              # Scheduled jobs
├── sessions/          # Gateway session state
└── logs/              # agent.log, gateway.log, errors.log (secrets auto-redacted)

上面的每个文件都有明确职责，彼此并不重叠。如果您在查找“Hermes 把 X 存在哪里”，答案就在其中之一。

v0.18.0 新增内容（The Judgment Release）

Hermes Agent v0.18.0（标签 v2026.7.1，2026年7月1日）以 judgment 命名：agent 会验证自己的工作，而不是直接声称成功；ensemble reasoning 也变得真正可检查。它还关闭了整个 P0/P1 backlog——约692个最高优先级事项在12天内得到解决。²²

Mixture-of-Agents 成为一等模型。 MoA 现在可以像其他模型一样在所有界面中选择，并且 ensemble reasoning 可见：每个 reference model 的完整输出都会渲染为独立的带标签块，并支持实时答案流式输出——您可以观察 ensemble 的思考过程，而不是只得到一个不透明的合并答案。²²
/goal 的完成契约。 agent 会在报告目标完成前运行项目检查来验证自己的工作，而不是直接声称成功——这是应用于自身的 judgment。²²
/learn——把任何描述转成 skill。 只需描述一个工作流，即可将其转化为可复用的 skill；生成的 skill 会自动遵循仓库的 CONTRIBUTING.md 约定。²²
/journey 时间线。 按时间展示 memory 和 skill 的可视化历史，支持编辑，并在桌面端提供 memory graph。²²
后台 subagent 扇出。 委托多个并发运行且不阻塞对话的任务——v0.17.0 的单个后台 subagent 现在扩展为一组。²²
Desktop Projects。 提供一等 coding Projects，并采用 project/repo/lane 组织模型。²²
可缩容至零的 gateway。 gateway 可在空闲时进入休眠，并协调 drain 以实现平滑部署——这对任何将 Hermes 作为常驻服务运行的人都很有意义。²²
Google Vertex AI 支持。 通过 GCP 服务账号访问 Gemini，并自动刷新 OAuth2 token，加入 provider 目录。²²
/prompt 编辑器命令。 打开 $EDITOR 来编写多行提示词，不必再受输入行限制。²²

如果您正从 v0.17.x 升级，这里没有任何内容会破坏 CLI。升级的主要理由是完成契约（会自我验证的目标）、一等 MoA 与可检查的 ensemble，以及用于捕获 skill 的 /learn。

v0.17.0 新增内容（The Reach Release）

Hermes Agent v0.17.0（标签 v2026.6.19，2026年6月19日）以 agent 现在能够触达的范围命名——新的消息渠道、新的模型 provider，以及更深入的桌面端和 dashboard 控制。它是在 v0.16.x 之上的增量版本；CLI 界面保持不变。²¹

新的消息渠道。 iMessage 现在可通过 Photon Spectrum 在无需 Mac relay 的情况下工作（设备代码 OAuth，hermes photon login）；WhatsApp Business Cloud API 是官方 Meta 适配器，取代了 bridge process 要求；SimpleX 增加了群组、原生附件、文本批处理和自动接受；Raft 则作为内置平台插件加入，采用 privacy-by-contract wake-channel 设计。²¹
新的模型和 provider。 目录新增 z-ai/glm-5.2（1M context）、anthropic/claude-fable-5、laguna-m.1、nemotron-3-ultra 和 grok-composer-2.5-fast（通过 xAI OAuth 使用 Cursor 的模型，200k context）。xAI 默认模型已迁移到 grok-build-0.1，并且 Anthropic adaptive models 现在遵循现代 thinking contract（它们绝不会发送 reasoning 字段）。²¹
桌面端和 dashboard。 桌面端新增后台 subagents，可通过实时“watch-windows”流式展示委托活动（delegate_task(background=true)）、Composer 模型选择器、可重新绑定的键盘快捷键、原生 OS 通知、每个 thread 的 composer 草稿、VS Code Marketplace 主题，以及日语和繁体中文 UI。dashboard 新增完整 profile builder（无需编辑 config.yaml 即可配置 model/skills/MCPs）、全局 profile 切换器、重做后的 Skills Hub（包含安全扫描）、Automation Blueprints（覆盖表单、slash command、conversation 和 docs 的参数化模板），以及在 OAuth gate 后返回 401 的安全登录。²¹
Skill 和工具。 image_generate 现在可在所有受支持的 image provider 中编辑和转换源图像，而不仅仅是从零创建图像；memory 工具新增 operations 数组，可在一次调用中原子化批量 add/replace/remove；新的 simplify-code skill 会运行并行的三 agent review-and-cleanup 流程，并由 Chesterton’s-Fence 风险层级把关；布尔值 write_approval 取代了三态 write_mode。²¹
架构。 后台 subagent 会立即返回 handle，并将其结果作为新的 turn 重新进入；MCP elicitation handler 允许在工具调用中途确认，并且后连接的 MCP 工具会在 turn 之间暴露（cache-safe）；cron 成为可插拔的 CronScheduler，并提供 Chronos managed-cron provider；新的 Managed scope（/etc/hermes）允许管理员固定用户不可变配置，同时还提供用于多 gateway 拓扑的 Gateway-Gateway relay。²¹
新命令。 /version、/billing（交互式终端账单）、hermes photon login（iMessage auth）和 hermes curator run --consolidate——consolidation 现在为可选项，因此常规后台 curation 消耗 0 token。²¹
安全。 v0.17.0 修复了 shell-escape denylist bypass，在缺失 approval module 和 own-policy gateway adapter 时 fail closed，为 cron job-script 子进程清理环境，在 request debug dump 中遮蔽 secret，筛查 MCP stdio config 中的 exfil pattern，并升级 urllib3 和 PyJWT 以清除 CVE。²¹

如果您正从 v0.16.x 升级，这里没有任何内容会破坏 CLI；它是在同一个 agent 周围增加新的渠道、模型和界面。无需 relay 的 iMessage、官方 WhatsApp 适配器，以及管理员 Managed scope 是升级的主要理由。

v0.16.0 新增内容（The Surface Release）

Hermes Agent v0.16.0（标签 v2026.6.5，2026年6月5日）以它放在 CLI 优先 agent 前方的新界面命名。核心变化是：Hermes 不再只限于终端。²⁰

原生桌面应用。 Hermes Desktop 是面向 macOS、Linux 和 Windows 的全新 Electron 应用，支持一键安装和应用内自动更新。它提供流式聊天窗口、拖放文件、剪贴板图片粘贴、Cmd+K 命令面板、带归档和搜索功能的会话列表，以及状态栏模型选择器。它可以通过安全的 WebSocket 连接到远程 Hermes gateway，并通过 OAuth 或用户名/密码进行身份验证；同时支持按 profile 配置远程主机，以及通过跨 profile @session 引用关联的并发多 profile 会话。桌面 UI 还通过类型化 i18n 层（display.language；默认仍为英语）提供完整的简体中文（简体中文）翻译。²⁰
浏览器管理面板。 本地 web dashboard 已从状态视图升级为完整管理面板：包含带启用/禁用开关的 MCP 目录、凭据管理、webhook 和 hook 创建、memory 配置、gateway 控制，以及带更新前检查和一键 Debug Share 的 System 页面。新的 Channels 页面可在浏览器中配置所有 gateway 消息平台（Telegram、Discord、Slack 等）。身份验证现在支持插件化：用户名/密码登录、通用自托管 OIDC provider、用于自托管 OAuth client 的 hermes dashboard register，以及 refresh-token 会话轮换。²⁰
新的 CLI 与 slash commands。 /undo [N] 会备份最近 N 轮用户对话，支持预填充和软删除，并可在 CLI、TUI 以及各消息平台中使用。可配置的默认界面（cli 与 tui）已上线，并提供 --cli 覆盖选项；TUI 新增统一的 /model 命令和 Sessions 覆盖层。hermes portal 是 Nous Portal onboarding 流程的易读别名，并新增 Quick Setup 与 Full Setup 两种首次运行路径；同时加入两个诊断命令：hermes prompt-size 和 hermes sessions optimize。²⁰
新模型和 providers。 选择器新增 deepseek-v4-flash、MiniMax-M3（1M context，原生 MiniMax providers）、qwen3.7-plus（Nous + OpenRouter）和 gemini-3.5-flash（Gemini OAuth + API key）。一等 xAI Grok OAuth provider 加入桌面启动器，模型选择器在所有界面上都支持模糊搜索，多 endpoint providers 会归入同一行，目录刷新频率也从每日改为每小时。²⁰
更精简的 skills 与渐进式披露。 默认 skill 集移除了冗余和废弃的 skills（Spotify 迁移到原生 plugin，Linear 迁移到 hermes mcp install linear，并删除了若干过时条目），将更多内容移入可选项，并新增 environments: frontmatter 相关性门控（kanban/docker/s6），使特定 context 的 skills 在被请求前不会进入索引。NVIDIA/skills 现在与 OpenAI、Anthropic 和 HuggingFace 一起成为默认可信的 Skills Hub tap。MCP 和 plugin tools 获得渐进式（限定范围）tool 披露能力；同时修复了一个 MCP bug，该 bug 会在未获得 token 时误报 OAuth 成功。²⁰
安全性。 v0.16.0 固定使用已修补的 Starlette（≥1.0.1）以应对 CVE-2026-48710（BadHost），在 async 路径中将 SSRF URL 检查移出 event loop，从 subprocess env 中剥离 Bedrock inference bearer token，将 bws_cache.json 加入文件安全读取保护，为危险模式列表加入 docker restart/stop/kill，并对已审核 skill 内容中的不可见 Unicode 进行清理。本次发布关闭了 2 个 P0 和 62 个 P1 问题，其中 16 个带有 security 标签。²⁰

如果您从 v0.15.x 升级，这些内容都不会对 CLI 本身构成 breaking change；它们是在同一个 agent 周围增加的界面和 providers。如果希望为非终端用户运行 Hermes，或从浏览器管理远程 gateway，桌面应用和管理面板就是升级的主要理由。

安装

对大多数用户来说，一行安装器仍然是推荐的引导路径。它会处理 Python、uv、Node.js、ripgrep、ffmpeg、repo clone、virtual environment，以及全局 hermes 命令。⁷ v0.14.0 还提供了真正的 PyPI package，因此当您已经能够控制 Python environment 时，pip install hermes-agent 现在也是可行的直接安装方式。¹⁹

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

pip install hermes-agent
hermes

适用于 Linux、macOS、WSL2 和 Android/Termux（安装器会自动检测 Termux，并切换到经过测试的 Android bundle）。⁷ v0.14.0 通过 PowerShell 安装器加入了早期 beta 阶段的原生 Windows 支持，但在 Windows 路径更加成熟之前，生产使用仍更建议选择 WSL2。¹⁹

完成后：

source ~/.bashrc    # or ~/.zshrc
hermes              # Start chatting

唯一前置条件是 git。安装器会通过 uv 自动配置 Python 3.11（无需 sudo）、Node.js v22（用于浏览器自动化和 WhatsApp bridge）、ripgrep 和 ffmpeg。⁷

验证安装

hermes version      # Check version
hermes doctor       # Diagnose config/dependency issues
hermes status       # Show current configuration + auth state
hermes dump         # Copy-pasteable setup summary for debugging

hermes doctor 会准确告诉您缺少什么以及如何修复。⁷ 请求帮助时，hermes dump 是可以粘贴到 GitHub issue 或 Discord thread 中的诊断命令——它会以纯文本汇总整个设置，并对 secrets 进行脱敏。⁸

手动安装

如果需要完全控制安装过程，例如自定义 Python 版本、指定 extras、集成 Nix/NixOS，上游安装指南已逐步记录手动流程。⁷ 可以与 uv pip install -e ".[<extras>]" 组合使用的关键可选 extras 如下：

Extra	添加内容
`all`	下方所有内容
`messaging`	Telegram 与 Discord gateway
`cron`	Cron 表达式解析
`cli`	setup wizard 的终端菜单 UI
`modal`	Modal cloud execution backend
`voice`	CLI 麦克风输入 + 音频播放
`tts-premium`	ElevenLabs premium voices
`honcho`	AI-native memory（Honcho integration）
`mcp`	Model Context Protocol 支持
`homeassistant`	Home Assistant integration
`acp`	ACP editor integration 支持
`slack`	Slack messaging
`pty`	PTY terminal 支持（交互式 CLI tools）
`dev`	pytest 与测试实用工具
`termux`	经过测试的 Android bundle（包含 `cron`、`cli`、`pty`、`mcp`、`honcho`、`acp`）

Termux 安装命令不同——它使用带 constraints file 的 pip，而不是 uv pip：

python -m pip install -e ".[termux]" -c constraints-termux.txt

这是因为 Android 上的 .[all] 会通过 voice extra 拉取 faster-whisper，而后者依赖的 ctranslate2 wheels 并未面向 Android 发布。⁷

身份验证与提供商

Hermes支持约19个一等提供商以及自定义端点，并提供3种不同的身份验证路径。下面按路径整理完整的身份验证范围，便于您找到与现有条件匹配的方式。

3种身份验证路径

Hermes中的每个提供商都属于以下3种身份验证模式之一：

路径1 — .env中的API密钥。 将密钥放入~/.hermes/.env，Hermes会在启动时读取。OpenRouter、AI Gateway、z.ai/GLM、Kimi/Moonshot、MiniMax（以及MiniMax China）、Alibaba Cloud/DashScope、Kilo Code、OpenCode Zen、OpenCode Go、DeepSeek、Hugging Face、Google/Gemini以及大多数第三方提供商都使用此方式。²

路径2 — 通过hermes model或hermes auth使用OAuth。 启动设备代码流程，打开浏览器，将凭据存储在~/.hermes/auth.json中（也可以从Claude Code或Codex CLI等工具导入现有凭据）。Nous Portal、OpenAI Codex（ChatGPT账户）、GitHub Copilot和Anthropic（Claude Pro/Max）使用此方式。²

路径3 — config.yaml中的自定义端点。 适用于任何兼容OpenAI的API，包括Ollama、vLLM、SGLang、llama.cpp、LM Studio、LiteLLM代理、Together AI、Groq、Azure OpenAI，或您自己的自托管服务器。通过hermes model → Custom endpoint配置一次后，会持久保存到config.yaml。²

完整提供商矩阵

下面是一等提供商的完整列表，并列出每个提供商的确切设置流程。²

提供商	身份验证路径	设置
Nous Portal	OAuth	`hermes model`（OAuth登录，基于订阅）
OpenAI Codex	OAuth	`hermes model`（ChatGPT设备代码，使用Codex模型）
GitHub Copilot	OAuth或令牌	`hermes model`（OAuth设备代码），或`COPILOT_GITHUB_TOKEN` / `GH_TOKEN` / `gh auth token`
GitHub Copilot ACP	本地子进程	`hermes model`（要求PATH中有`copilot` CLI并执行过`copilot login`）
Anthropic	OAuth或API密钥	`hermes model`（优先使用Claude Code凭据），或`ANTHROPIC_API_KEY`，或`ANTHROPIC_TOKEN`设置令牌
OpenRouter	API密钥	`~/.hermes/.env`中的`OPENROUTER_API_KEY`
AI Gateway (Vercel)	API密钥	`~/.hermes/.env`中的`AI_GATEWAY_API_KEY`（提供商：`ai-gateway`）
z.ai / GLM (ZhipuAI)	API密钥	`~/.hermes/.env`中的`GLM_API_KEY`（提供商：`zai`）
Kimi / Moonshot	API密钥	`~/.hermes/.env`中的`KIMI_API_KEY`（提供商：`kimi-coding`）
MiniMax (global)	API密钥	`~/.hermes/.env`中的`MINIMAX_API_KEY`（提供商：`minimax`）
MiniMax China	API密钥	`~/.hermes/.env`中的`MINIMAX_CN_API_KEY`（提供商：`minimax-cn`）
Alibaba Cloud (Qwen)	API密钥	`~/.hermes/.env`中的`DASHSCOPE_API_KEY`（提供商：`alibaba`，别名：`dashscope`、`qwen`）
Kilo Code	API密钥	`~/.hermes/.env`中的`KILOCODE_API_KEY`（提供商：`kilocode`）
OpenCode Zen	API密钥	`~/.hermes/.env`中的`OPENCODE_ZEN_API_KEY`（提供商：`opencode-zen`）
OpenCode Go	API密钥	`~/.hermes/.env`中的`OPENCODE_GO_API_KEY`（提供商：`opencode-go`）
DeepSeek	API密钥	`~/.hermes/.env`中的`DEEPSEEK_API_KEY`（提供商：`deepseek`）
Hugging Face	API密钥	`~/.hermes/.env`中的`HF_TOKEN`（提供商：`huggingface`，别名：`hf`）
Google / Gemini	API密钥	`~/.hermes/.env`中的`GOOGLE_API_KEY`或`GEMINI_API_KEY`（提供商：`gemini`）
xAI (Grok)	原生提供商 / SuperGrok OAuth	一等提供商，支持直接API访问和模型目录（v0.9.0+）。v0.14.0新增SuperGrok OAuth，并将有权限账户的grok-4.3提升到1M上下文窗口。²¹⁶¹⁹ v0.17.0新增`grok-composer-2.5-fast`（通过xAI OAuth访问的Cursor模型，200k上下文），并将xAI默认模型改为`grok-build-0.1`。²¹
xAI Custom Voices	API密钥	支持语音克隆的TTS提供商。v0.13.0新增；在`config.yaml`的`tts:`下配置，并在`.env`中提供xAI密钥。¹⁸
Xiaomi MiMo	原生提供商	一等提供商，包含设置向导和模型目录。Nous Portal上的免费MiMo v2 Pro可用于辅助任务（v0.9.0+）。¹⁶¹⁵
Google AI Studio	API密钥	`~/.hermes/.env`中的`GOOGLE_API_KEY`或`GEMINI_API_KEY`。通过models.dev注册表自动检测上下文长度，直接访问Gemini（v0.8.0+）。¹⁵
Qwen Cloud	OAuth	支持门户请求的OAuth提供商（v0.8.0+）。该提供商在v0.14.0中由Alibaba Cloud重命名为Qwen Cloud；现有配置键仍然有效。¹⁵¹⁹
Custom endpoint	config.yaml	`hermes model` → “Custom endpoint”（保存到`config.yaml`）

Anthropic：3种身份验证方法

Anthropic单独成节，是因为Hermes支持3条不同路径进入Claude，选对方式至关重要。根据上游文档：²

# Method 1: API key (pay-per-token)
export ANTHROPIC_API_KEY=***
hermes chat --provider anthropic --model claude-sonnet-4-6

# Method 2: OAuth through hermes model (preferred)
# Uses Claude Code's credential store when available
hermes model

# Method 3: Manual setup-token (fallback/legacy)
export ANTHROPIC_TOKEN=***
hermes chat --provider anthropic

# Auto-detect Claude Code credentials
hermes chat --provider anthropic   # reads Claude Code files automatically

通过hermes model选择Anthropic OAuth时，Hermes会优先使用Claude Code自己的凭据存储，而不是将令牌复制到~/.hermes/.env。这样可保持Claude凭据可刷新。² 如果您已经在同一台机器上使用Claude Code，这是最干净利落的路径。

要在config.yaml中永久固定Anthropic：

model:
  provider: "anthropic"
  default: "claude-sonnet-4-6"

--provider claude和--provider claude-code也可作为--provider anthropic的简写。²

GitHub Copilot：两种模式

Copilot支持两种模式：直接Copilot API（推荐）和Copilot ACP（将本地Copilot CLI作为子进程启动）。²

# Direct Copilot API
hermes chat --provider copilot --model gpt-5.4

# Copilot ACP (requires the Copilot CLI in PATH + an existing copilot login)
hermes chat --provider copilot-acp --model copilot-acp

根据上游文档，身份验证按以下顺序检查：² 1. COPILOT_GITHUB_TOKEN环境变量 2. GH_TOKEN环境变量 3. GITHUB_TOKEN环境变量 4. gh auth token CLI回退 5. 通过hermes model进行OAuth设备代码登录

令牌类型很重要。 Copilot API不支持经典Personal Access Tokens（ghp_*）。支持的类型包括OAuth令牌（gho_*）、细粒度PAT（带有Copilot Requests权限的github_pat_*）以及GitHub App令牌（ghu_*）。如果您的gh auth token返回ghp_*令牌，请改用hermes model通过OAuth进行身份验证。²

中国AI提供商（一等支持）

Hermes内置支持z.ai/GLM、Kimi/Moonshot、MiniMax（全球+中国端点）以及Alibaba Cloud，并提供专用提供商ID。²

# z.ai / ZhipuAI GLM
hermes chat --provider zai --model glm-5                 # Requires: GLM_API_KEY

# Kimi / Moonshot AI
hermes chat --provider kimi-coding --model kimi-for-coding   # Requires: KIMI_API_KEY

# MiniMax (global)
hermes chat --provider minimax --model MiniMax-M2.7          # Requires: MINIMAX_API_KEY

# MiniMax (China)
hermes chat --provider minimax-cn --model MiniMax-M2.7       # Requires: MINIMAX_CN_API_KEY

# Alibaba Cloud / DashScope (Qwen)
hermes chat --provider alibaba --model qwen3.5-plus          # Requires: DASHSCOPE_API_KEY

可以使用GLM_BASE_URL、KIMI_BASE_URL、MINIMAX_BASE_URL、MINIMAX_CN_BASE_URL或DASHSCOPE_BASE_URL环境变量覆盖基础URL。²

Z.AI会自动检测端点。 使用z.ai/GLM提供商时，Hermes会探测多个端点（全球、中国、coding变体），找到能够接受您的API密钥的端点。可用端点会自动缓存，因此大多数用户无需设置GLM_BASE_URL。²

xAI (Grok)会自动启用提示缓存。 当基础URL包含x.ai时，Hermes会在每个请求中发送x-grok-conv-id标头，将同一会话中的请求路由到同一服务器，从而复用缓存的系统提示和历史记录。² 这是自动行为，无需配置。

`hermes auth`命令

hermes auth是用于凭据池和OAuth凭据的凭据管理命令。⁶

hermes auth                              # Interactive wizard
hermes auth list                         # Show all credential pools
hermes auth list openrouter              # Show one provider's pool
hermes auth add openrouter --api-key sk-or-v1-xxx
hermes auth add anthropic --type oauth
hermes auth remove openrouter 2          # Remove by index
hermes auth reset openrouter             # Clear cooldowns

凭据池用于为同一提供商轮换多个API密钥或OAuth令牌。如果希望在不改代码的情况下把速率限制分摊到多个密钥上，这会很有用。⁶ 旧版hermes login / hermes logout命令已移除；请改用hermes auth。⁶

自定义与自托管端点

Hermes可与任何兼容OpenAI的API端点配合使用。只要服务器实现了/v1/chat/completions，就可以让Hermes指向它。²

交互式设置（推荐）：

hermes model
# Select "Custom endpoint (self-hosted / VLLM / etc.)"
# Enter: API base URL, API key, Model name

手动config.yaml：

model:
  default: your-model-name
  provider: custom
  base_url: http://localhost:8000/v1
  api_key: your-key-or-leave-empty-for-local

两种方式都会持久保存到config.yaml，它是主模型、提供商和基础URL的单一事实来源。² 旧版环境变量OPENAI_BASE_URL和LLM_MODEL已不再用于主模型配置；请使用hermes model，或直接编辑config.yaml。² （OPENAI_BASE_URL + OPENAI_API_KEY仍会作为辅助provider: "main"路由路径的回退被识别；如果您在那里使用它们，不要轻易删除。）⁴

在会话中途切换自定义端点：

/model custom:qwen-2.5             # Custom endpoint with explicit model
/model custom                      # Auto-detect the model from the endpoint
/model custom:local:qwen-2.5       # Named custom provider "local"
/model custom:work:llama3          # Named custom provider "work"
/model openrouter:claude-sonnet-4  # Back to a cloud provider

/model custom（仅此命令，不带模型名）会查询端点的/v1/models API；如果只加载了一个模型，就会自动选择该模型。这对运行单一模型的本地服务器很有用。²

本地LLM服务器（设置模板）

上游文档提供了Ollama、vLLM、SGLang、llama.cpp和LM Studio的完整设置指南。下面是您实际会运行的关键命令。每个模板都旨在生成一个可供Hermes指向的工作端点。²

Ollama — 最简单的本地路径，零配置：

ollama pull qwen2.5-coder:32b
OLLAMA_CONTEXT_LENGTH=32768 ollama serve   # Raise from 4k default
hermes model   # Custom endpoint → http://localhost:11434/v1 → qwen2.5-coder:32b

关键Ollama注意事项： Ollama默认使用很低的上下文长度（24GB VRAM下为4,096个token）。必须通过OLLAMA_CONTEXT_LENGTH或Modelfile提高它。兼容OpenAI的API不接受客户端传入的上下文长度，因此Hermes无法替您设置。² 对于Agent用途，请至少设置为16k–32k。

vLLM — 高性能GPU服务：

pip install vllm
vllm serve meta-llama/Llama-3.1-70B-Instruct \
  --port 8000 \
  --max-model-len 65536 \
  --tensor-parallel-size 2 \
  --enable-auto-tool-choice \
  --tool-call-parser hermes

工具调用需要--enable-auto-tool-choice和--tool-call-parser <name>。支持的解析器包括：hermes（Qwen 2.5、Hermes 2/3）、llama3_json、mistral、deepseek_v3、deepseek_v31、xlam、pythonic。没有这些标志时，工具调用会以纯文本形式返回。²

SGLang — 使用RadixAttention复用KV缓存的快速服务：

pip install "sglang[all]"
python -m sglang.launch_server \
  --model meta-llama/Llama-3.1-70B-Instruct \
  --port 30000 \
  --context-length 65536 \
  --tp 2 \
  --tool-call-parser qwen

SGLang注意事项： 默认max_tokens为128。如果响应被截断，请在服务器上设置--default-max-tokens，或在config.yaml中配置model.max_tokens。²

llama.cpp / llama-server — CPU和Apple Silicon Metal：

./build/bin/llama-server \
  --jinja -fa \
  -c 32768 \
  -ngl 99 \
  -m models/qwen2.5-coder-32b-instruct-Q4_K_M.gguf \
  --port 8080 --host 0.0.0.0

工具调用需要--jinja。 没有它，llama-server会完全忽略tools参数，模型会尝试在响应文本中写入JSON来调用工具，而Hermes无法将其解析为真正的工具调用。²

LM Studio — 带GUI的桌面应用：

从LM Studio应用中启动服务器（Developer标签页 → Start Server），或通过CLI执行：lms server start（在端口1234启动）和lms load qwen2.5-coder --context-length 32768。² 然后将hermes model指向http://localhost:1234/v1。

关键LM Studio注意事项： LM Studio会从模型元数据读取上下文长度，但许多GGUF模型报告的默认值是2048或4096。请务必在LM Studio模型设置中显式设置上下文长度：点击模型选择器旁边的齿轮图标，将“Context Length”设为至少16384（最好32768），然后重新加载模型。²

命名自定义提供商

如果您使用多个自定义端点（例如本地开发服务器和远程GPU服务器），请在config.yaml中将它们定义为命名自定义提供商：²

custom_providers:
  - name: local
    base_url: http://localhost:8080/v1
    # api_key omitted — Hermes uses "no-key-required" for keyless local servers
  - name: work
    base_url: https://gpu-server.internal.corp/v1
    api_key: corp-api-key
    api_mode: chat_completions      # optional, auto-detected from URL
  - name: anthropic-proxy
    base_url: https://proxy.example.com/anthropic
    api_key: proxy-key
    api_mode: anthropic_messages    # for Anthropic-compatible proxies

然后使用三段语法在会话中途切换：

/model custom:local:qwen-2.5
/model custom:work:llama3-70b
/model custom:anthropic-proxy:claude-sonnet-4

也可以从交互式hermes model菜单中选择命名自定义提供商。²

可插拔提供商架构（v0.13.0+）

v0.13.0提供了一个ProviderProfile ABC以及plugins/model-providers/目录，使第三方推理提供商无需修改核心代码即可接入。¹⁸ 如果某个提供商使用兼容OpenAI、Anthropic或Codex的API模式，您可以实现一个ProviderProfile子类，用它声明身份验证路径、基础URL、模型目录和缓存标头；Hermes会通过内置提供商使用的同一runtime_provider.py路径解析它。这正是v0.13.0提供商扩展背后的架构变化：添加提供商不再需要编辑核心代码，而是发布一个插件。

兼容OpenAI的本地代理（v0.14.0+）

hermes proxy会公开一个兼容OpenAI的本地端点，后端使用Hermes已经登录的OAuth提供商，例如Claude Pro、ChatGPT Pro、SuperGrok或其他已配置的兼容提供商。¹⁹ 这意味着期望OpenAI风格API的工具，包括Codex CLI、Aider、Cline、Continue或自定义脚本，都可以复用您由订阅支持的Hermes身份验证，而无需单独的API密钥。请将该代理视为本地开发基础设施：有意绑定它，不要广泛暴露，并留意各提供商的具体条款。

上下文长度检测

根据上游文档，下面两个设置经常被混淆：²

context_length — 总上下文窗口（输入+输出token预算合计，例如Claude Opus 4.7为1,000,000，Sonnet 4.6为200,000）。Hermes用它判断何时压缩历史记录。
model.max_tokens — 输出上限（模型在单次响应中可生成的最大token数）。与历史长度无关。

当自动检测得到的窗口大小不正确时，设置context_length：

model:
  default: "qwen3.5:9b"
  base_url: "http://localhost:8080/v1"
  context_length: 131072      # tokens

Hermes使用多来源解析链检测上下文窗口：配置覆盖 → 自定义提供商的逐模型配置 → 持久缓存 → 端点/models → Anthropic /v1/models → OpenRouter API → Nous Portal → models.dev（社区维护的3800+模型注册表）→ 回退默认值（128K）。² 该系统感知提供商，因此同一模型可能因服务方不同而有不同上下文限制（例如claude-opus-4.6在Anthropic直连时为1M，但在GitHub Copilot上为128K）。²

提供商轮换与回退

凭据池。 如果您为同一提供商拥有多个API密钥，可通过hermes auth配置轮换策略。这就是在多个密钥之间分摊速率限制的方式。⁶

回退模型。 配置一个备用provider:model，当主模型失败（速率限制、服务器错误、身份验证失败）时，Hermes会自动切换过去：²

fallback_model:
  provider: openrouter            # required
  model: anthropic/claude-sonnet-4  # required
  # base_url: http://localhost:8000/v1    # optional, for custom endpoints
  # api_key_env: MY_CUSTOM_KEY           # optional, env var name

回退会在会话中途替换模型和提供商，同时保留对话。每个会话最多触发一次。² 支持回退的提供商包括：openrouter、nous、openai-codex、copilot、copilot-acp、anthropic、huggingface、zai、kimi-coding、minimax、minimax-cn、deepseek、ai-gateway、opencode-zen、opencode-go、kilocode、alibaba、custom。²

辅助模型

Hermes使用轻量级“辅助”模型处理旁路任务：图像分析、网页摘要、浏览器截图分析、危险命令审批分类、上下文压缩、会话搜索摘要、skill匹配、MCP工具调度和内存刷新。⁴ 默认情况下，这些任务通过自动检测使用Gemini Flash（OpenRouter → Nous → Codex）。

可以为每个辅助任务配置使用哪个模型和提供商。 每个辅助槽位都使用相同的3个旋钮：provider、model、base_url。⁴

auxiliary:
  vision:
    provider: "auto"                # "auto", "openrouter", "nous", "codex", "main", etc.
    model: ""                       # e.g. "openai/gpt-4o", "google/gemini-2.5-flash"
    base_url: ""                    # Custom OpenAI-compatible endpoint
    api_key: ""                     # Falls back to OPENAI_API_KEY
    timeout: 30
    download_timeout: 30
  web_extract:
    provider: "auto"
    model: ""
    timeout: 360
  approval:
    provider: "auto"
    model: ""
    timeout: 30
  compression:
    timeout: 120
  session_search: { provider: "auto", model: "", timeout: 30 }
  skills_hub:    { provider: "auto", model: "", timeout: 30 }
  mcp:           { provider: "auto", model: "", timeout: 30 }
  flush_memories:{ provider: "auto", model: "", timeout: 30 }

"main"提供商选项表示“使用我的主Agent正在使用的任何提供商”——它仅在auxiliary:、compression:和fallback_model:配置中有效。它对顶层model.provider设置无效。如果主模型使用自定义兼容OpenAI的端点，请在model:部分设置provider: custom。⁴

为什么这很重要： 如果您只配置了Anthropic OAuth（没有OpenRouter密钥），视觉、网页摘要和压缩会降级或失败，因为默认辅助回退链会先尝试OpenRouter。请为辅助任务添加OPENROUTER_API_KEY，或将每个辅助槽位重新配置为使用主提供商：

auxiliary:
  vision:
    provider: "main"
  web_extract:
    provider: "main"

这是Hermes新用户最常见的“我的功能静默失效”问题。

配置系统

Hermes采用分层配置系统。理解其优先级至关重要，因为较高层会覆盖较低层，其中一层还是您在config.yaml中看不到的全局提供商注册表。

配置文件布局

根据上游文档，以下文件共同组成Hermes配置：⁴

~/.hermes/
├── config.yaml       # All settings (model, terminal, TTS, compression, memory, toolsets, ...)
├── .env              # Secrets (API keys, bot tokens, passwords)
├── auth.json         # OAuth provider credentials (Nous Portal, Codex, Anthropic)
├── SOUL.md           # Primary agent identity (slot #1 in system prompt)
├── memories/         # Persistent memory (MEMORY.md, USER.md)
├── skills/           # Bundled + agent-created + hub-installed skills
├── cron/             # Scheduled jobs
├── sessions/         # Gateway session state
└── logs/             # agent.log, gateway.log, errors.log (secrets auto-redacted)

config.yaml与.env：当两者都设置时，非机密设置以config.yaml为准。⁴规则如下： - 机密信息（API密钥、bot令牌、密码）→ .env - 其他所有内容（模型、终端后端、压缩设置、内存限制、toolset）→ config.yaml

机密信息可以在config.yaml中使用shell风格插值来引用：⁴

auxiliary:
  vision:
    api_key: ${GOOGLE_API_KEY}
    base_url: ${CUSTOM_VISION_URL}
  delegation:
    api_key: ${DELEGATION_KEY}

管理配置

hermes config                # View current configuration
hermes config show           # Same as above
hermes config edit           # Open config.yaml in your editor
hermes config set KEY VAL    # Set a specific value
hermes config path           # Print the config file path
hermes config env-path       # Print the .env file path
hermes config check          # Check for missing options (after updates)
hermes config migrate        # Interactively add missing options

示例：⁴

hermes config set model anthropic/claude-opus-4
hermes config set terminal.backend docker
hermes config set OPENROUTER_API_KEY sk-or-...   # Saves to .env

hermes config check和hermes config migrate是每次hermes update之后都应运行的命令，它们会发现文件中尚未包含的新配置选项。⁶

配置优先级

Hermes会从多个来源加载配置。当多个来源设置了同一个值时，优先级更高的来源生效：⁴

CLI参数——hermes chat --model anthropic/claude-sonnet-4（单次调用覆盖）
环境变量——在进程启动时应用
config.yaml——主要设置文件
.env——仅用于机密信息
内置默认值——当没有其他来源设置某个值时应用

CLI标志始终只对该次调用生效并拥有最高优先级。config.yaml是长期的事实来源。

本地化（v0.13.0+）

v0.13.0为CLI和gateway消息新增了7种语言区域：中文（简体）、日语、德语、西班牙语、法语、乌克兰语和土耳其语。¹⁸v0.14.0对所有gateway命令和Web仪表板进行了本地化，新增8种语言区域，总数达到16种。¹⁹当前文档仅提供zh-Hans本地化版本。语言区域会根据LC_ALL/LANG环境变量解析，也可以通过config.yaml中的显式locale:键指定。英语仍是默认语言，也是任何尚未翻译字符串的事实来源。

Profiles——多个隔离的Hermes实例

profile为您提供多个相互隔离的Hermes实例，每个实例都有自己的配置、会话、skill、内存和gateway PID。借助这种方式，可以并行运行“工作Hermes”和“个人Hermes”，且双方都无法看到对方的状态。⁶

hermes profile list
hermes profile create work --clone                  # Clone from current profile
hermes profile use work                             # Set sticky default
hermes profile alias work --name h-work             # Create wrapper script
hermes profile export work -o work-backup.tar.gz
hermes profile import work-backup.tar.gz --name restored
hermes -p work chat -q "Hello from work profile"    # One-off without switching

每个profile都有自己的HERMES_HOME（默认是~/.hermes-<name>/），因此多个profile可以并发运行gateway，而不会相互干扰。⁶³

CLI 命令

本节是面向实践者的顶层CLI命令参考。若需权威的代码生成参考，请参阅上游CLI命令参考。⁶

全局选项

hermes [global-options] <command> [subcommand/options]

选项	说明
`--version`, `-V`	显示版本并退出
`--profile <name>`, `-p <name>`	选择要使用的 Hermes profile
`--resume <session>`, `-r <session>`	按 ID 或标题恢复 session
`--continue [name]`, `-c [name]`	恢复最近的 session（或匹配某个标题）
`--worktree`, `-w`	在隔离的 git worktree 中启动
`--yolo`	跳过危险命令的批准提示
`--pass-session-id`	在 agent 的系统提示中包含 session ID

顶层命令

命令	用途
`hermes chat`	交互式或一次性聊天
`hermes model`	以交互方式选择默认 provider 和 model
`hermes gateway`	运行或管理消息 gateway
`hermes setup`	交互式设置向导
`hermes auth`	管理凭据——添加、列出、移除、重置、设置策略
`hermes status`	显示 agent、auth 和平台状态
`hermes cron`	检查并触发 cron 调度器
`hermes webhook`	管理动态 webhook 订阅
`hermes doctor`	诊断配置和依赖项问题
`hermes dump`	生成可复制粘贴的设置摘要，用于支持/调试
`hermes logs`	查看、跟踪和筛选 agent/gateway/error 日志
`hermes config`	显示、编辑、迁移、查询配置
`hermes pairing`	批准或撤销消息配对码
`hermes skills`	浏览、安装、发布、审计 skill
`hermes honcho`	管理 Honcho 跨 session 记忆
`hermes memory`	配置外部记忆 provider
`hermes acp`	将 Hermes 作为 ACP 服务器运行（编辑器集成）
`hermes mcp`	管理MCP服务器配置；将 Hermes 作为MCP服务器运行
`hermes plugins`	管理插件
`hermes tools`	按平台配置启用的工具
`hermes sessions`	浏览、导出、裁剪、删除 session
`hermes insights`	显示 token/成本/活动分析
`hermes claw`	OpenClaw 迁移辅助工具
`hermes profile`	管理 profile（多个隔离实例）
`hermes completion`	打印 shell 补全脚本（bash/zsh）
`hermes whatsapp`	配置并配对 WhatsApp bridge
`hermes version`	打印版本信息
`hermes update`	拉取最新代码并重新安装依赖项
`hermes uninstall`	从系统中移除 Hermes（`--full`还会删除配置/数据）
`hermes backup`	完整备份配置、session、skill 和记忆（v0.9.0+）¹⁶
`hermes import`	从备份归档恢复——在机器之间迁移或回滚（v0.9.0+）¹⁶
`hermes dashboard`	启动本地 Web dashboard，用于基于浏览器的 agent 管理（v0.9.0+）¹⁶
`hermes debug share`	将完整调试报告上传到 pastebin，便于排查问题时共享（v0.9.0+）¹⁶

`hermes chat`——主入口

不带参数运行hermes会进入交互式聊天。hermes chat是带选项的显式形式：⁶

hermes chat -q "Summarize the latest PRs"           # One-shot, non-interactive
hermes chat --provider openrouter --model anthropic/claude-sonnet-4.6
hermes chat --toolsets web,terminal,skills          # Enable specific toolsets
hermes chat --quiet -q "Return only JSON"           # Programmatic mode
hermes chat --worktree -q "Review repo and open a PR"

关键选项：

选项	说明
`-q`, `--query "..."`	一次性、非交互式提示
`-m`, `--model <model>`	为本次运行覆盖 model
`-t`, `--toolsets <csv>`	启用一组以逗号分隔的 toolset
`--provider <provider>`	强制指定 provider（见完整列表）
`-s`, `--skills <name>`	为此 session 预加载一个或多个 skill
`-v`, `--verbose`	详细输出
`-Q`, `--quiet`	程序化模式（无横幅、spinner、预览）
`--resume <session>`	直接从`chat`恢复 session
`--worktree`	创建隔离的 git worktree
`--checkpoints`	在破坏性更改前启用文件系统 checkpoint
`--yolo`	跳过批准提示
`--source <tag>`	session 来源标签（默认：`cli`；集成场景使用`tool`）
`--max-turns <N>`	每轮最大工具调用迭代次数（默认：90）

`hermes setup`——完整向导

运行完整设置向导，或直接跳转到某个部分：⁶

hermes setup                 # Full wizard
hermes setup model           # Provider and model only
hermes setup terminal        # Terminal backend only
hermes setup gateway         # Messaging platforms only
hermes setup tools           # Tool enable/disable per platform
hermes setup agent           # Agent behavior only
hermes setup --non-interactive
hermes setup --reset         # Reset config to defaults before setup

`hermes logs`——结构化日志查询

hermes logs比对日志文件执行tail -f更强大，因为它支持同时按级别、session ID 和时间范围筛选。⁶

hermes logs                          # Last 50 lines of agent.log
hermes logs -f                       # Follow in real time
hermes logs gateway -n 100           # Last 100 lines of gateway.log
hermes logs --level WARNING --since 1h   # Warnings from the last hour
hermes logs --session abc123         # Filter by session ID substring
hermes logs errors --since 30m -f    # Follow errors.log from 30m ago
hermes logs list                     # List all log files with sizes

日志文件位于~/.hermes/logs/：⁶ - agent.log——所有 agent 活动（API调用、工具分发、session 生命周期、INFO+） - errors.log——仅警告和错误（agent.log 的筛选子集） - gateway.log——消息 gateway 活动（平台连接、分发、webhook）

轮转通过Python的RotatingFileHandler自动完成——请查找agent.log.1、agent.log.2等文件。⁶

`hermes doctor`——诊断

hermes doctor [--fix]是在出现问题时首先应运行的命令。它会检查配置有效性、依赖项是否存在、API密钥可用性、服务状态，并可通过--fix尝试自动修复。⁶

如需与他人共享诊断信息，请使用hermes dump——它会生成一份紧凑的纯文本摘要，并对API密钥进行脱敏，可直接粘贴到GitHub issue 或 Discord 线程中。⁶

Slash Commands

Slash commands在活动聊天会话（CLI或消息平台）内运行。它们由hermes_cli/commands.py中的共享COMMAND_REGISTRY分发，因此大多数命令在不同入口上的行为完全一致。⁹

会话控制

命令	说明
`/new`（别名`/reset`）	启动新会话
`/clear`	清空屏幕并启动新会话
`/history`	显示对话历史
`/save`	保存当前对话
`/retry`	重试上一条消息
`/undo`	移除上一轮用户/助手交互
`/title <name>`	为当前会话设置标题
`/compress`	手动压缩对话上下文
`/rollback [number]`	列出或恢复文件系统checkpoint
`/stop`	终止所有正在运行的后台进程
`/queue <prompt>`	将prompt排入下一轮队列。注意：`/q`同时被`/queue`和`/quit`声明；最后注册者生效，实际中`/q`会解析为`/quit`——请始终明确输入`/queue`。⁹
`/resume [name]`	恢复之前命名的会话
`/statusbar`（别名`/sb`）	切换上下文/model状态栏
`/background <prompt>`（别名`/bg`）	在独立后台会话中运行prompt
`/btw <question>`	临时旁支问题（无工具，不持久化）
`/plan [request]`	加载内置`plan` skill以编写计划，而不是执行
`/branch [name]`（别名`/fork`）	从当前会话创建分支
`/goal <target>`	将agent锁定到一个目标，使其在多轮对话中保持任务方向。Ralph-loop模式作为一等原语。可配置轮次预算。v0.13.0新增。¹⁸
`/subgoal <criterion>`	在不重启循环的情况下，为活动`/goal`添加成功标准。v0.14.0新增。¹⁹
`/handoff <target>`	将实时会话（消息、tool call和上下文）转交给另一个model、persona或profile。v0.14.0新增。¹⁹

配置与Model

命令	说明
`/config`	显示当前配置
`/model [model-name]`	显示或更改当前model
`/provider`	显示可用provider和当前provider
`/personality [name]`	设置personality叠加层
`/verbose`	循环切换工具进度显示
`/reasoning`	管理推理力度与显示方式
`/skin`	显示或更改显示皮肤/主题
`/voice [on\\|off\\|tts\\|status]`	切换CLI语音模式
`/yolo`	切换YOLO模式（跳过批准提示）
`/fast`	切换Fast Mode——为OpenAI和Anthropic models启用优先处理（v0.9.0+）¹⁶
`/debug`	跨所有平台快速诊断（v0.9.0+）¹⁶

/model命令是在会话中途切换provider的核心工具：⁹

/model                              # Show current model and options
/model claude-sonnet-4              # Switch model (auto-detect provider)
/model zai:glm-5                    # Switch provider:model
/model custom:qwen-2.5              # Use model on custom endpoint
/model custom                       # Auto-detect model from custom endpoint
/model custom:local:qwen-2.5        # Named custom provider
/model openrouter:anthropic/claude-sonnet-4   # Back to cloud

工具、Skills与信息

命令	说明
`/tools [list\\|disable\\|enable] [name...]`	管理当前会话的工具
`/toolsets`	列出可用toolset
`/browser [connect\\|disconnect\\|status]`	管理本地Chrome CDP连接
`/skills`	搜索、安装、检查或管理skills
`/cron`	管理计划任务
`/reload-mcp`	从config.yaml重新加载MCP服务器
`/plugins`	列出已安装插件
`/help`	显示所有命令
`/usage`	显示token用量、费用、时长
`/insights`	显示使用情况分析（最近30天）
`/platforms`	显示消息平台状态
`/profile`	显示活动profile名称和主目录

动态Skill Slash Commands

每个已安装的skill都会自动暴露为slash command：⁹

/gif-search funny cats
/axolotl help me fine-tune Llama 3 on my dataset
/github-pr-workflow create a PR for the auth refactor
/excalidraw       # Just the skill name loads it and lets the agent ask what you need

还可以在config.yaml中定义quick commands，将短名称别名映射到更长的prompt：⁹

quick_commands:
  review: "Review my latest git diff and suggest improvements"
  deploy: "Run the deployment script at scripts/deploy.sh and verify the output"
  morning: "Check my calendar, unread emails, and summarize today's priorities"

然后在CLI中输入/review、/deploy或/morning。

前缀匹配

命令支持前缀匹配：输入/h会解析为/help，输入/mod会解析为/model。当前缀存在歧义时，按registry顺序最先注册的命令胜出。完整命令名称和已注册别名始终优先于前缀匹配。⁹

消息平台专用命令

有些命令仅适用于消息平台（Telegram、Discord、Slack、WhatsApp、Signal、Email、Home Assistant）：⁹

/status——显示会话信息
/sethome（别名/set-home）——将当前聊天标记为平台home
/approve [session|always]——批准待处理的危险命令
/deny——拒绝待处理的危险命令
/update——将Hermes Agent更新到最新版本
/commands [page]——浏览所有命令和skills（分页）

还有一些命令仅适用于CLI：/skin、/tools、/toolsets、/browser、/config、/cron、/skills、/platforms、/paste、/statusbar、/plugins。⁹

Tools与Toolsets

Hermes内置了覆盖面广泛的工具注册表，涵盖网页搜索、浏览器自动化、终端执行、文件编辑、memory、委派、RL训练、消息投递、Home Assistant集成等能力。¹⁰工具会组织为逻辑化的toolsets，可按平台启用或禁用。

高层类别

类别	示例	说明
Web	`web_search`, `web_extract`	搜索网页并提取页面内容
终端与文件	`terminal`, `process`, `read_file`, `patch`	执行命令并操作文件
Browser	`browser_navigate`, `browser_snapshot`, `browser_vision`	结合文本和视觉的交互式浏览器自动化
Media	`vision_analyze`, `video_analyze`, `video_generate`, `image_generate`, `text_to_speech`	多模态分析与生成。`video_analyze`以Gemini优先，并可扩展支持兼容的多模态providers（v0.13.0+）。v0.14.0新增统一的`video_generate`，支持可插拔provider后端；当活动模型具备视觉能力时，会通过`vision_analyze`发送原始像素。¹⁸¹⁹
Agent编排	`todo`, `clarify`, `execute_code`, `delegate_task`	规划、澄清、代码执行、subagent委派
Computer use	`computer_use`	通过cua-driver后端控制桌面；v0.14.0使其可配合非Anthropic且具备视觉能力的providers使用。¹⁹
Memory与recall	`memory`, `session_search`	持久化memory + 会话搜索
自动化与投递	`cronjob`, `send_message`	定时任务、出站消息
集成	`ha_`, MCP tools, `rl_`	Home Assistant、MCP、RL训练

常见toolset名称包括web、terminal、file、browser、vision、image_gen、moa、skills、tts、todo、memory、session_search、cronjob、code_execution、delegation、clarify、homeassistant和rl。¹⁰

管理Tools

hermes chat --toolsets "web,terminal"       # Use specific toolsets
hermes tools                                # Interactive per-platform tool config
hermes tools --summary                      # Print enabled-tools summary

也可以在会话中途通过/tools disable <name>和/tools enable <name>切换tools。这会重置会话，使新的tool集生效。⁹

终端后端

终端工具可在6种不同环境中执行命令：¹⁰

后端	使用场景
`local`	在本机运行（默认）——开发、可信任务
`docker`	隔离容器——安全性、可复现性
`ssh`	远程服务器——沙盒，使agent远离自身代码
`singularity`	HPC容器——集群计算、无root
`modal`	无服务器云端执行
`daytona`	云沙盒workspace——持久化远程开发环境

可使用hermes config set terminal.backend <name>切换后端，或在config.yaml中配置：

terminal:
  backend: docker      # or: local, ssh, singularity, modal, daytona
  cwd: "."             # Working directory
  timeout: 180         # Command timeout in seconds

SSH后端（推荐用于安全场景——agent无法修改自身代码）：¹⁰

terminal:
  backend: ssh

# In ~/.hermes/.env
TERMINAL_SSH_HOST=my-server.example.com
TERMINAL_SSH_USER=myuser
TERMINAL_SSH_KEY=~/.ssh/id_rsa

Docker后端：

terminal:
  backend: docker
  docker_image: python:3.11-slim

容器资源（适用于docker、singularity、modal、daytona）：¹⁰

terminal:
  container_cpu: 1
  container_memory: 5120          # MB (default 5GB)
  container_disk: 51200           # MB (default 50GB)
  container_persistent: true      # Persist filesystem across sessions

设置container_persistent: true后，已安装的软件包、文件和配置会跨会话保留。¹⁰

所有容器后端都会启用安全加固：只读根文件系统（Docker）、丢弃除DAC_OVERRIDE、CHOWN和FOWNER之外的所有Linux capabilities、禁止权限提升、PID限制（256个进程）、完整namespace隔离、通过卷实现持久化workspace。¹⁰

后台进程

终端工具支持后台执行，并提供显式进程管理：¹⁰

terminal(command="pytest -v tests/", background=true)
# Returns: {"session_id": "proc_abc123", "pid": 12345}

process(action="list")                            # Show all running processes
process(action="poll", session_id="proc_abc123")  # Check status
process(action="wait", session_id="proc_abc123")  # Block until done
process(action="log", session_id="proc_abc123")   # Full output
process(action="kill", session_id="proc_abc123")  # Terminate
process(action="write", session_id="proc_abc123", data="y")  # Send input

PTY模式（pty=true）可启用Codex和Claude Code等交互式CLI工具。¹⁰

Sudo

如果命令需要sudo，Hermes会提示输入密码（在当前会话中缓存）。也可以在~/.hermes/.env中设置SUDO_PASSWORD。¹⁰

Multi-Agent Kanban（v0.13.0+）

v0.13.0将multi-agent协作升级为一等基础能力：一个持久化Kanban看板，可跨agents、跨重启跟踪任务、状态和worker身份。¹⁸这个看板让一组Hermes workers真正完成工作，而不是卡在失效的交接上。

机制	作用
Heartbeats	每个worker在拥有任务时持续发送脉冲。heartbeat缺失会将worker标记为可疑，并释放任务以供回收。
Reclaim	另一个worker可以接手被放弃的任务，并保留完整任务状态和此前的部分输出。
Zombie detection	未将任务标记为完成就退出的workers会被自动阻止领取新工作，避免swarm累积失效身份。
Hallucination gate	未通过gate的输出不会被标记为完成，而是附带原因返回看板。
按任务设置`max_retries`	对已知脆弱的任务覆盖默认重试预算。
多项目看板	一个Hermes home可以托管多个相互独立的看板。

Kanban看板天然适合与目标侧的/goal（锁定目标Ralph循环）配合，也适合与现有delegate_task工具配合以实现spawn语义。最终形成一种swarm模式：每个agent共享同一个事实来源，明确接下来该做什么、由谁负责，以及哪些事项受阻。

Skills 系统

Skills 是 agent 可在需要时加载的按需知识文档。它们采用渐进式披露模式，以尽量减少 token 使用量，并兼容 agentskills.io 开放标准。¹¹

所有 skills 都位于 ~/.hermes/skills/——这是主目录和唯一可信来源。全新安装时，捆绑的 skills 会从 repo 复制过来。通过 Hub 安装和由 agent 创建的 skills 也会放在这里。¹¹

渐进式披露

Level 0: skills_list()           → [{name, description, category}, ...]   (~3k tokens)
Level 1: skill_view(name)        → Full content + metadata                 (varies)
Level 2: skill_view(name, path)  → Specific reference file                 (varies)

agent 只有在实际需要时，才会加载完整的 skill 内容。¹¹

SKILL.md 格式

---
name: my-skill
description: Brief description of what this skill does
version: 1.0.0
platforms: [macos, linux]      # Optional — restrict to OS platforms
metadata:
  hermes:
    tags: [python, automation]
    category: devops
    fallback_for_toolsets: [web]     # Conditional activation
    requires_toolsets: [terminal]    # Conditional activation
    config:                          # Config.yaml settings
      - key: my.setting
        description: "What this controls"
        default: "value"
        prompt: "Prompt for setup"
---

# Skill Title

## When to Use
Trigger conditions for this skill.

## Procedure
1. Step one
2. Step two

## Pitfalls
- Known failure modes and fixes

## Verification
How to confirm it worked.

条件激活

Skills 可以根据可用工具显示或隐藏自身。这对于fallback skills尤其有用：当高级工具不可用时，才应显示免费的或本地的替代方案：¹¹

字段	行为
`fallback_for_toolsets`	当列出的 toolset 可用时隐藏 skill
`fallback_for_tools`	相同，但检查单个工具
`requires_toolsets`	当列出的 toolset 不可用时隐藏 skill
`requires_tools`	相同，但检查单个工具

示例：内置的 duckduckgo-search skill 使用 fallback_for_toolsets: [web]。当您设置了 FIRECRAWL_API_KEY 后，web toolset 可用，agent 会使用 web_search——DuckDuckGo skill 保持隐藏。没有 API key 时，DuckDuckGo skill 会自动作为 fallback 出现。¹¹

Agent 管理的 Skills

agent 可以通过 skill_manage 工具创建、更新和删除自己的 skills。这是 agent 的过程性记忆：当它摸索出一个非平凡的工作流时，会将该方法保存为 skill，以便日后复用。¹¹

agent 创建 skills 的时机：¹¹ - 成功完成复杂任务后（5 次以上工具调用） - 遇到错误或走入死胡同，并找到可行路径时 - 用户纠正其方法时 - 发现非平凡工作流时

操作：¹¹

操作	用途
`create`	从零创建新 skill
`patch`	定向修复（首选方式，token 效率最高）
`edit`	大幅结构性重写
`delete`	完全移除一个 skill
`write_file`	添加/更新支持文件
`remove_file`	移除支持文件

Skill Hub

从在线注册表浏览、搜索、安装和管理 skills：⁶¹¹

hermes skills browse                          # Browse all hub skills
hermes skills browse --source official        # Browse official optional skills
hermes skills search kubernetes               # Search all sources
hermes skills search react --source skills-sh # Search skills.sh directory
hermes skills inspect openai/skills/k8s       # Preview before installing
hermes skills install openai/skills/k8s       # Install with security scan
hermes skills install skills-sh/anthropics/skills/pdf --force
hermes skills check                           # Check for upstream updates
hermes skills update                          # Reinstall changed hub skills
hermes skills audit                           # Re-scan installed hub skills
hermes skills uninstall k8s
hermes skills publish skills/my-skill --to github --repo owner/repo
hermes skills tap add myorg/skills-repo       # Add custom GitHub source

集成的 hub 来源：¹¹

来源	示例	说明
`official`	`official/security/1password`	随 Hermes 提供的可选 skills（builtin 信任）
`skills-sh`	`skills-sh/vercel-labs/agent-skills/vercel-react-best-practices`	Vercel 的公共 skills 目录
`well-known`	`well-known:https://mintlify.com/docs/.well-known/skills/mintlify`	基于 URL 的发现，来自发布 `/.well-known/skills/index.json` 的站点
`github`	`openai/skills/k8s`	直接安装 GitHub repo/path
`clawhub`	—	第三方 skills 市场
`claude-marketplace`	—	兼容 Claude 的 plugin/市场 manifest
`lobehub`	—	LobeHub agent 目录转换

默认 GitHub taps（无需设置即可浏览）：openai/skills、anthropics/skills、VoltAgent/awesome-agent-skills、garrytan/gstack。¹¹

安全扫描

所有通过 hub 安装的 skills 都会经过安全扫描器检查，涵盖数据外泄、prompt 注入、破坏性命令、供应链信号及其他威胁。¹¹

信任级别：¹¹

级别	来源	策略
`builtin`	随 Hermes 提供	始终信任
`official`	repo 中的 `optional-skills/`	builtin 信任，无第三方警告
`trusted`	可信注册表（`openai/skills`、`anthropics/skills`）	策略更宽松
`community`	其他所有来源	非危险发现可用 `--force` 覆盖；`dangerous` 判定仍会被阻止

--force 可以覆盖 community skills 的非危险策略阻止。它不会覆盖 dangerous 扫描判定。¹¹

外部 Skill 目录

您可以将 Hermes 指向其他 skill 目录，这些目录会与本地目录一起扫描：¹¹

skills:
  external_dirs:
    - ~/.agents/skills
    - /home/shared/team-skills
    - ${SKILLS_REPO}/skills

路径支持 ~ 展开和 ${VAR} 环境变量替换。外部目录是只读的：当 agent 创建或编辑 skill 时，始终会写入 ~/.hermes/skills/。如果两个位置存在同名 skill，则本地优先级更高。¹¹

持久化记忆

Hermes具备有界且经过整理的记忆，可跨会话持久保存。agent的记忆由两个文件组成，二者都存储在~/.hermes/memories/中：¹²

文件	用途	字符限制
`MEMORY.md`	agent的个人笔记——环境事实、约定、已学习事项	2,200个字符（约800个token）
`USER.md`	用户画像——偏好、沟通风格、期望	1,375个字符（约500个token）

二者都会作为会话开始时的冻结快照注入系统提示。agent通过memory工具管理自己的记忆——add、replace或remove。¹²

冻结快照模式：系统提示注入只在会话开始时捕获一次，会话中途不会变化。这是有意设计的——它会保留LLM的前缀缓存以提升性能。会话期间所做的更改会立即持久化到磁盘，但直到下一次会话才会出现在系统提示中。¹²

应保存的内容

保存这些内容（agent会主动执行）：¹² - 用户偏好：“我更喜欢TypeScript而不是JavaScript”→user - 环境事实：“此服务器运行Debian 12和PostgreSQL 16”→memory - 纠正信息：“不要对Docker命令使用sudo，用户在docker组中”→memory - 约定：“项目使用制表符、120字符行宽、Google风格docstring”→memory - 已完成工作：“已于2026-01-15将数据库从MySQL迁移到PostgreSQL”→memory

跳过这些内容：¹² - 琐碎或显而易见的信息 - 容易重新发现的事实 - 原始数据转储（对记忆来说过大） - 仅限当前会话的临时信息 - 上下文文件中已有的信息

会话搜索

除MEMORY.md和USER.md之外，agent还可以使用session_search工具搜索过往对话。所有CLI和消息会话都会存储在SQLite（~/.hermes/state.db）中，并支持FTS5全文搜索。查询会返回相关过往对话，并使用Gemini Flash进行摘要。¹²

功能	持久化记忆	会话搜索
容量	总计约1,300个token	不限（所有会话）
速度	即时（在系统提示中）	需要搜索+LLM摘要
使用场景	始终可用的关键事实	查找特定过往对话
管理方式	由agent手动整理	自动——存储所有会话
token成本	每个会话固定（约1,300个token）	按需产生

外部记忆提供商

对于超出MEMORY.md和USER.md的更深层持久化记忆，Hermes内置8个外部记忆提供商插件：Honcho、OpenViking、Mem0、Hindsight、Holographic、RetainDB、ByteRover和Supermemory。¹²

外部提供商会与内置记忆并行运行（绝不替代内置记忆），并增加知识图谱、语义搜索、自动事实提取和跨会话用户建模等能力：⁶¹²

hermes memory setup         # Pick a provider and configure it
hermes memory status        # Check what's active
hermes memory off           # Disable external provider (built-in only)

一次只能启用一个外部提供商。内置记忆始终启用。⁶

会话自动恢复（v0.13.0+）

v0.13.0让agent中途被中断也能恢复。gateway会在重启后自动恢复被中断的会话；/update重启会在升级期间保留会话状态；开发期间源文件重新加载会保持活动会话，而不是强制创建新会话。¹⁸实际效果是：长时间运行的gateway工作和cron驱动任务在进程重启时不再重置其上下文窗口。

Checkpoints v2（v0.13.0+）

v0.13.0将状态持久化重写为单一存储设计，具备真正的剪枝、磁盘保护栏，且不再产生孤立影子仓库。¹⁸此前的checkpoint系统会在长时间运行的profile中持续在磁盘上累积状态；v2存储为本地checkpoint存储设置了硬性上限，并移除了导致增长的重复记账逻辑。不需要修改面向用户的配置；下一次checkpoint写入会使用v2路径。

Personality与SOUL.md

SOUL.md是Hermes实例的主要身份。它占据系统提示中的第1个槽位，取代硬编码的默认身份。¹³

Hermes会自动在~/.hermes/SOUL.md（或自定义profile的$HERMES_HOME/SOUL.md）生成默认SOUL.md。已有用户文件绝不会被覆盖。Hermes只会从HERMES_HOME加载SOUL.md——不会查看当前工作目录。这使得personality在不同项目之间保持可预测。¹³

SOUL.md中应包含什么

将其用于持久的语气和personality指导：¹³ - 语气 - 沟通风格 - 直接程度 - 默认交互风格 - 风格上应避免的内容 - Hermes应如何处理不确定性、分歧和歧义

较少用于：¹³ - 一次性项目指令 - 文件路径 - 仓库约定 - 临时工作流细节

这些应放在AGENTS.md中，而不是SOUL.md。

SOUL.md与AGENTS.md

这是Hermes身份管理中最重要的区别：¹³

SOUL.md——身份、语气、风格、沟通默认值、personality级别行为。

AGENTS.md——项目架构、编码约定、工具偏好、仓库特定工作流、命令、端口、路径、部署说明。

一个实用规则：如果它应随您到处生效，就放在SOUL.md。如果它属于某个项目，就放在AGENTS.md。¹³

内置Personalities

Hermes内置了可通过/personality切换的personalities：¹³

名称	描述
`helpful`	友好、通用型助手
`concise`	简短、直截了当的回答
`technical`	详细、准确的技术专家
`creative`	创新、跳出框架的思考
`teacher`	有耐心的教育者，提供清晰示例
`kawaii`	可爱表达、闪亮感、热情
`catgirl`	带猫系表达的Neko-chan
`pirate`	Captain Hermes，懂技术的海盗
`shakespeare`	具有戏剧张力的吟游诗人式散文
`surfer`	放松的bro氛围
`noir`	硬汉侦探叙事
`uwu`	最高可爱度，使用uwu式表达
`philosopher`	对每个问题进行深度思辨
`hype`	MAXIMUM ENERGY

config.yaml中的自定义personalities：¹³

agent:
  personalities:
    codereviewer: >
      You are a meticulous code reviewer. Identify bugs, security issues,
      performance concerns, and unclear design choices. Be precise and constructive.

然后使用/personality codereviewer切换。

SOUL.md与`/personality`

SOUL.md是基准声音。/personality是会话级叠加层。¹³建议保持务实的默认SOUL.md，然后在辅导对话中使用/personality teacher，或在头脑风暴时使用/personality creative。

Nous Tool Gateway（v0.10.0+）

自Hermes Agent v0.10.0（2026-04-16）起，付费Nous Portal订阅者可通过现有Portal凭据获得一组精选工具的托管访问权限——无需管理额外的API密钥。²⁶Hermes CLI本身仍采用MIT许可，并且完全开源。变化在于，您的Portal身份验证现在解锁的不只是模型推理。

gateway中包含什么

工具	提供商	使用场景
Web搜索	Firecrawl	为需要新鲜信息的agent检索内容
图像生成	FAL / FLUX 2 Pro	无需配置FAL密钥即可内联生成图像
文本转语音	OpenAI TTS	messaging gateway上的语音输出
浏览器自动化	Browser Use	无头导航和抓取

工作原理

gateway通过新的use_gateway配置字段按工具选择启用。如果您在hermes auth中有Portal凭据，且为某个工具启用了gateway，该工具调用就会通过Portal路由。否则会使用您的直接API密钥（如果存在）。

# config.yaml — per-tool gateway opt-in
tools:
  web_search:
    provider: firecrawl
    use_gateway: true          # route via Nous Portal subscription
  image_generation:
    provider: fal
    use_gateway: true

运行时优先级：当gateway可用且某个工具设置了use_gateway: true时，即使也配置了直接API密钥，Hermes也会优先使用gateway。这对计费很重要——gateway调用会从您的Portal订阅中扣取，而不是从直接API密钥的余额中扣取。

启用gateway

hermes model                      # select Nous Portal (OAuth flow)
hermes tools                      # per-platform tool picker integrates gateway tools
hermes status                     # confirms gateway/subscription detection

不存在单独的hermes subscribe或hermes login --portal命令。订阅会根据您已经在hermes auth中拥有的Portal OAuth凭据自动检测。

定价和访问权限

定价和套餐名称发布在Nous Portal定价页面（https://portal.nousresearch.com/pricing）。本指南不逐一列出套餐，因为这些由Portal产品负责，而不是Hermes CLI负责，并且它们会独立于Hermes版本变化。请在https://portal.nousresearch.com/注册，并查看定价页面了解当前套餐。

弃用通知

HERMES_ENABLE_NOUS_MANAGED_TOOLS环境变量已在v0.10.0中移除。托管工具现在通过按工具配置的use_gateway字段启用，并根据您的Portal订阅状态进行门控。²⁶

定位：此版本不是什么

Hermes Agent CLI并未被置于订阅之后。该项目仍采用MIT许可，所有核心功能（CLI、skills、memory、messaging gateway、cron、MCP、本地dashboard、每个提供商的BYOK）都可以在不向任何人付费的情况下端到端运行。v0.10.0为已经付费使用Nous Portal的用户增加了一条便捷路径——它不会从免费路径中移除任何东西。

Messaging Gateway

Hermes可以作为长期运行的gateway进程，从单个gateway进程连接到22个消息平台：Telegram、Discord、Slack、WhatsApp、Signal、SMS、Email、Home Assistant、Mattermost、Matrix、DingTalk、Feishu/Lark、WeCom、Weixin（WeChat）、BlueBubbles（iMessage）、QQBot、Microsoft Teams、Tencent Yuanbao、Google Chat、LINE、SimpleX Chat，以及通用Webhook适配器。³²⁵¹⁷¹⁸¹⁹ v0.9.0通过BlueBubbles加入了iMessage支持（自动webhook注册、设置向导、崩溃韧性），并通过iLink Bot API加入原生WeChat支持，同时为企业应用提供WeCom回调模式。¹⁶ v0.11.0加入了QQBot。²⁵ v0.12.0加入了Microsoft Teams和Tencent Yuanbao。¹⁷ v0.13.0加入Google Chat作为第20个平台，沿用同一套可插拔适配器架构；IRC和Microsoft Teams也迁移到新的适配器模式，并支持通用env_enablement_fn / cron_deliver_env_var插件钩子。¹⁸ v0.14.0加入LINE和SimpleX Chat，并通过Graph认证、webhook监听器、pipeline运行时和出站投递，端到端补齐Microsoft Teams栈。¹⁹ v0.17.0（2026年6月19日）加入通过Photon Spectrum实现的无中继iMessage（设备码OAuth，使用hermes photon login——不再需要Mac/BlueBubbles中继）、官方WhatsApp Business Cloud API适配器（取代桥接进程要求）、SimpleX群组和原生附件，以及作为内置平台插件的Raft。²¹

设置

hermes gateway setup                # Interactive platform configuration
hermes gateway install              # Install as user service (systemd/launchd)
hermes gateway start                # Start the installed service
hermes gateway stop
hermes gateway restart
hermes gateway status
hermes gateway run                  # Run in foreground (debugging)

交互式设置会引导您连接每个平台：API令牌、bot ID、频道映射、allowlist。⁶

消息如何流转

来自上游架构文档：³

Platform event → Adapter.on_message() → MessageEvent
  → GatewayRunner._handle_message()
    → authorize user
    → resolve session key
    → create AIAgent with session history
    → AIAgent.run_conversation()
    → deliver response back through adapter

每个消息平台都通过与CLI相同的AIAgent会话循环运行。这就是为什么slash命令在两处的行为完全一致，也解释了为什么在Telegram中调度的cron作业可以把输出投递到Discord——平台差异只存在于边缘层。³

用户授权与配对

hermes pairing list                    # Show pending and approved users
hermes pairing approve <platform> <code>
hermes pairing revoke <platform> <user-id>
hermes pairing clear-pending

配对码可防止陌生人随意访问您的gateway。用户从自己的消息平台发送配对码；您使用hermes pairing approve批准后，该用户从此即获得授权。⁶

计划任务（Cron）

Hermes拥有一套一等公民级cron系统，其中作业是agent任务，而不是shell命令。每个计划作业都会通过一个全新的AIAgent运行，使用已配置的prompt、可选附加skill，并将结果投递到任意平台：³⁶

hermes cron list
hermes cron create --prompt "Check HN for AI news and summarize" --schedule "0 9 * * *" --deliver telegram
hermes cron edit <id>
hermes cron pause <id>
hermes cron resume <id>
hermes cron run <id>         # Trigger now on the next tick
hermes cron remove <id>
hermes cron status           # Check if scheduler is running
hermes cron tick             # Run due jobs once and exit

也可以在消息聊天中通过对话创建：

Every morning at 9am, check Hacker News for AI news and send me a summary on Telegram.

agent会通过其工具设置cron作业。作业会持久保存在JSON中，并在重启后继续保留。³

MCP集成

Hermes同时支持作为Model Context Protocol客户端和服务器：⁶

作为客户端——将Hermes连接到外部MCP服务器，以扩展其工具面：

hermes mcp add <name> --url https://example.com/mcp
hermes mcp add <name> --command npx --args "-y,@modelcontextprotocol/server-github"
hermes mcp list
hermes mcp test <name>
hermes mcp remove <name>
hermes mcp configure <name>   # Toggle individual tool selection

也可以在config.yaml中手动配置：¹⁴

mcp_servers:
  github:
    command: npx
    args: ["-y", "@modelcontextprotocol/server-github"]
    env:
      GITHUB_PERSONAL_ACCESS_TOKEN: "ghp_xxx"

作为服务器——向其他agent暴露Hermes会话：

hermes mcp serve
hermes mcp serve -v    # Verbose

上下文压缩

Hermes会自动压缩长会话，以保持在模型的上下文窗口内。压缩摘要器是一次独立的LLM调用——可以将它指向任何provider或endpoint。⁴

compression:
  enabled: true
  threshold: 0.50                           # Compress at this % of context limit
  target_ratio: 0.20                        # Fraction to preserve as recent tail
  protect_last_n: 20                        # Min recent messages to keep uncompressed
  summary_model: "google/gemini-3-flash-preview"
  summary_provider: "auto"                  # "auto", "openrouter", "nous", "codex", "main", etc.
  summary_base_url: null                    # Custom OpenAI-compatible endpoint

Provider选项：⁴

`summary_provider`	`summary_base_url`	结果
`auto`（默认）	未设置	自动检测最佳可用provider
`nous` / `openrouter` / etc.	未设置	强制使用该provider，并使用其认证
任意	已设置	直接使用自定义endpoint（忽略provider）

summary_model必须支持至少与主模型同等长度的上下文，因为它会接收会话的完整中段内容用于压缩。⁴

预算压力警告

当agent处理包含大量工具调用的复杂任务时，可能在没有意识到的情况下耗尽迭代预算（默认：90轮）。预算压力会自动向模型发出警告：⁴

阈值	级别	模型看到的内容
70%	谨慎	`[BUDGET: 63/90. 27 iterations left. Start consolidating.]`
90%	警告	`[BUDGET WARNING: 81/90. Only 9 left. Respond NOW.]`

流超时

LLM流式连接有两层超时机制，并会针对本地provider（localhost、LAN IP）自动调整：⁴

超时	默认值	本地provider	环境变量
Socket读取超时	120s	自动提高到1800s	`HERMES_STREAM_READ_TIMEOUT`
过期流检测	180s	自动禁用	`HERMES_STREAM_STALE_TIMEOUT`
API调用（非流式）	1800s	不变	`HERMES_API_TIMEOUT`

对于本地endpoint，socket读取超时会提高到30分钟，因为本地LLM在大上下文中可能需要数分钟完成prefill，之后才生成第一个token。⁴

本地Web Dashboard（v0.9.0+）

这是一个基于浏览器的dashboard，用于在本地管理Hermes Agent。无需接触配置文件或终端，即可配置设置、监控会话、浏览skill并管理gateway。¹⁶ 使用hermes dashboard启动。对于偏好GUI的新用户而言，这是最简单的入门路径。

后台进程监控（v0.9.0+）

watch_patterns允许设置模式来监控后台进程输出，并在匹配时实时收到通知。¹⁶ 可以监控错误、等待特定事件（“listening on port”），或查看构建日志——全程无需轮询。结合v0.8.0中的notify_on_complete（在后台任务完成时发出通知），Hermes现在具备完整的后台进程可观测性层。¹⁵

可插拔Context Engine（v0.9.0+）

现在可以通过hermes plugins将上下文管理作为可插拔slot使用。您可以替换为自定义context engine，控制agent在每一轮看到的内容——过滤、摘要，或注入特定领域上下文。¹⁶ 这将上下文策略从核心agent循环中解耦出来，从而允许按项目或按领域定制上下文。

备份与恢复（v0.9.0+）

hermes backup会创建包含配置、会话、skill和memory的完整归档。hermes import则从备份归档中恢复。¹⁶ 可用它在不同机器之间迁移、在重大变更前创建快照，或与团队成员共享已知可用的配置。

Termux / Android支持（v0.9.0+）

Hermes可通过Termux在Android上原生运行。适配后的安装路径、面向移动屏幕的TUI优化、语音后端支持，以及/image命令均可在设备本地使用。¹⁶

安全加固（v0.13.0+）

v0.13.0修复了8个P0安全问题，并将一个默认设置改为更有利于用户的取值。¹⁸ v0.14.0随后又关闭了12个P0和50个P1问题，包括sudo暴力破解/sudo-stdin加固、危险命令绕过修复、工具错误重新注入模型前的清理、dashboard plugin API身份验证、skills-hub SSRF覆盖，以及安装期间的供应链公告扫描。¹⁹

修复	变更内容
默认启用密钥脱敏	以前需要选择启用。现在，除非显式禁用，否则日志和`hermes debug share`上传都会对密钥进行脱敏。v0.12.0曾因载荷损坏报告而默认禁用脱敏；v0.13.0将其重新启用，作为更安全的基线。
Discord跨guild私信绕过（CVSS 8.1）	Discord角色允许列表现在限定在guild范围内，封堵了这样一条路径：用户在某个guild中的角色会授权其跨所有guild发送私信。
WhatsApp默认限制	WhatsApp适配器默认拒绝陌生人，并且绝不会在自聊中响应。
MCP OAuth TOCTOU窗口	修复了MCP OAuth流程中保存凭据时的竞态条件。
CLI `auth.json` TOCTOU	修复了CLI身份验证存储的凭据写入器中类似的TOCTOU窗口。
浏览器SSRF底线	混合路由会针对试图访问`169.254.169.254`及等价地址的请求，强制执行云元数据SSRF底线。
Cron提示注入扫描	在cron作业运行前，会扫描组装后的提示（包括已加载的skill内容）是否存在提示注入。
`hermes debug share`脱敏	debug share上传会在上传时对日志内容脱敏，而不只是写入时脱敏。

如果您维护Hermes部署，应将v0.13.0和v0.14.0视为安全相关升级，而不只是功能发布。v0.13.0修复了Discord跨guild绕过和两个TOCTOU窗口；v0.14.0则对sudo处理、工具错误重新注入、plugin API、skills-hub SSRF和依赖公告又进行了一轮加固。

面向实践者的架构

本节面向希望理解底层机制的人，以便进行调试、扩展或推理性能。内容综合自上游架构文档。³

入口点→AIAgent

Hermes中的每个入口点最终都会调用AIAgent.run_conversation()：

┌──────────────────────────────────────────────────────────────────┐
│                        Entry Points                              │
│                                                                  │
│  CLI (cli.py)    Gateway (gateway/run.py)    ACP (acp_adapter/)  │
│  Batch Runner    API Server                  Python Library     │
└──────────┬──────────────┬───────────────────────┬────────────────┘
           │              │                       │
           ▼              ▼                       ▼
┌──────────────────────────────────────────────────────────────────┐
│                     AIAgent (run_agent.py)                       │
│                                                                  │
│  ┌─────────────┐  ┌──────────────┐  ┌──────────────┐             │
│  │ Prompt      │  │ Provider     │  │ Tool         │             │
│  │ Builder     │  │ Resolution   │  │ Dispatch     │             │
│  └──────┬──────┘  └──────┬───────┘  └──────┬───────┘             │
│         │                │                 │                    │
│  ┌──────┴───────┐ ┌──────┴───────┐  ┌──────┴───────┐             │
│  │ Compression  │ │ 3 API Modes  │  │ Tool Registry│             │
│  │ & Caching    │ │ chat_compl   │  │ 47 tools     │             │
│  │              │ │ codex_resp   │  │ 20 toolsets  │             │
│  │              │ │ anthropic    │  │              │             │
│  └──────────────┘ └──────────────┘  └──────────────┘             │
└──────────────────────────────────────────────────────────────────┘

图示改编自上游架构文档。³

横幅中的“47 tools / 20 toolsets”和“28 tools”。“47 tools”数量指上游仓库的工具注册表总量，也就是Hermes随源代码提供的所有工具，覆盖所有toolset。实际运行中的CLI会在启动横幅中显示更小的数字（我验证本指南时使用的安装显示为28 tools / 89 skills）。这不是错误。许多toolset是可选启用的，必须在config.yaml的toolsets:下显式启用，例如消息平台适配器、浏览器自动化、较重的抓取工具等。注册表总数表示“可用内容”；横幅数字表示“当前profile中已启用的内容”。可以用hermes tools --list查看哪些toolset处于活动状态，并通过~/.hermes/config.yaml中的toolsets:块启用或禁用单个toolset（也可在运行中的会话内使用/tools list//tools enable <name>//tools disable <name>；移除工具会触发会话重置，以便agent重新构建工具清单）。

3种API模式

Hermes将不同提供商之间的差异抽象为3种API模式，并在运行时自动选择：³

API模式	使用方
`chat_completions`	OpenRouter、z.ai、Kimi、MiniMax、DeepSeek、Alibaba、大多数自定义端点、任何兼容OpenAI的服务器
`codex_responses`	OpenAI Codex（通过ChatGPT OAuth）
`anthropic_messages`	Anthropic API（原生）、Anthropic OAuth、兼容Anthropic的代理

runtime_provider.py解析器会将(provider, model)元组映射到(api_mode, api_key, base_url)，覆盖18个以上提供商，并处理OAuth流程、凭据池和别名解析。³

CLI会话中的数据流

User input → HermesCLI.process_input()
  → AIAgent.run_conversation()
    → prompt_builder.build_system_prompt()
    → runtime_provider.resolve_runtime_provider()
    → API call (chat_completions / codex_responses / anthropic_messages)
    → tool_calls? → model_tools.handle_function_call() → loop
    → final response → display → save to SessionDB

来自上游架构页面。³

提示组装顺序

提示栈包括：¹³

SOUL.md（agent身份；若不可用，则使用内置回退）
工具感知的行为指导
记忆/用户上下文（MEMORY.md、USER.md）
Skills指导
上下文文件（AGENTS.md、.cursorrules）
时间戳
特定平台的格式提示
可选的系统提示覆盖，例如/personality

SOUL.md是基础，其他所有内容都构建在它之上。¹³

会话存储

基于SQLite的会话存储，支持FTS5全文搜索。会话具备谱系跟踪（压缩前后的父/子关系）、按平台隔离，以及带争用处理的原子写入。³

插件系统

3个发现来源：~/.hermes/plugins/（用户）、.hermes/plugins/（项目）和pip入口点。插件通过上下文API注册工具、hook和CLI命令。内存提供商是一类专门的插件类型，位于plugins/memory/下。³

hermes plugins                       # Interactive enable/disable UI
hermes plugins install <repo>        # Install from Git URL or owner/repo
hermes plugins enable <name>
hermes plugins disable <name>
hermes plugins list

设计原则

来自上游架构页面：³

原则	实践含义
提示稳定性	系统提示不会在对话中途改变。除显式用户操作（`/model`）外，不会进行破坏缓存的变更
可观察执行	每次工具调用都会通过回调对用户可见。CLI（spinner）和gateway（聊天消息）中都会提供进度更新
可中断	API调用和工具执行可以由用户输入或信号在进行中取消
平台无关核心	一个`AIAgent`类服务于CLI、gateway、ACP、batch和API服务器。平台差异留在入口点中
松耦合	可选子系统（MCP、插件、内存提供商、RL环境）使用注册表模式和check_fn门控，而不是硬依赖
Profile隔离	每个profile都有自己的`HERMES_HOME`、配置、记忆、会话和gateway PID。多个profile可并发运行

从OpenClaw迁移

Hermes Agent是OpenClaw的继任者。如果您要从现有OpenClaw安装迁移：⁶⁵

hermes claw migrate --dry-run                    # Preview what would be migrated
hermes claw migrate --preset full                # Full migration including API keys
hermes claw migrate --preset user-data --overwrite   # User data only, no secrets
hermes claw migrate --source /custom/path        # Non-default OpenClaw location

hermes claw migrate默认从~/.openclaw读取（也会自动检测旧版~/.clawdbot和~/.moldbot目录），并写入~/.hermes。⁶

直接导入（30多个类别）：SOUL.md、MEMORY.md、USER.md、AGENTS.md、来自4个源目录的skills、默认模型、自定义提供商、MCP服务器、消息平台令牌和允许列表（Telegram、Discord、Slack、WhatsApp、Signal、Matrix、Mattermost）、agent默认值（推理强度、压缩、人类延迟、时区、sandbox）、会话重置策略、审批规则、TTS配置、浏览器设置、工具设置、exec超时、命令允许列表、gateway配置，以及来自3个来源的API密钥。⁶

归档以供人工审查：cron作业、插件、hook/webhook、内存后端（QMD）、skills注册表配置、UI/身份、日志、多agent设置、频道绑定、IDENTITY.md、TOOLS.md、HEARTBEAT.md、BOOTSTRAP.md。⁶

API密钥解析会按优先级顺序检查3个来源：配置值→~/.openclaw/.env→auth-profiles.json。⁶

故障排查

“API key not set”

运行hermes model以交互方式配置您的提供商，或运行hermes config set OPENROUTER_API_KEY your_key。hermes doctor命令会准确告诉您缺少哪些密钥。⁷

启动时出现“Context limit: 2048 tokens”（本地模型）

Hermes会从服务器的/v1/models端点自动检测上下文长度，但许多本地服务器会报告较低的默认值。请在config.yaml中显式设置：²

model:
  default: your-model
  provider: custom
  base_url: http://localhost:11434/v1
  context_length: 32768

工具调用显示为文本，而不是执行

您的服务器未启用工具调用，或该模型不支持通过服务器实现进行工具调用。²

服务器	修复方法
llama.cpp	在启动命令中添加`--jinja`
vLLM	添加`--enable-auto-tool-choice --tool-call-parser hermes`
SGLang	添加`--tool-call-parser qwen`（或合适的解析器）
Ollama	工具调用默认启用——请使用`ollama show <model>`检查您的模型是否支持
LM Studio	更新到0.3.6+，并使用原生支持工具的模型

响应在句子中间被截断

可能有两个原因：²

服务器上的输出上限较低（max_tokens）——SGLang默认每次响应128个token。请在服务器上设置--default-max-tokens，或在config.yaml中配置model.max_tokens。
上下文耗尽——模型填满了上下文窗口。请增加model.context_length，或在Hermes中启用上下文压缩。

从WSL2连接Windows托管的模型服务器时出现“Connection refused”

WSL2使用带有独立子网的虚拟网络适配器——WSL2内的localhost指向Linux虚拟机，而不是Windows主机。有两个选项：²

镜像网络（Windows 11 22H2+）：编辑%USERPROFILE%\.wslconfig：

[wsl2]
networkingMode=mirrored

然后运行wsl --shutdown并重启。现在localhost可双向工作。

主机IP回退（较旧版本Windows）：从WSL2内部获取Windows主机IP，并使用它代替localhost：

ip route show | grep -i default | awk '{ print $3 }'
# Use that IP as the base_url host

还需要让模型服务器绑定到0.0.0.0，而不是127.0.0.1——对于Ollama，设置OLLAMA_HOST=0.0.0.0；对于llama-server/SGLang，添加--host 0.0.0.0；或在LM Studio中启用“Serve on Network”。²

所有内容在哪里？

hermes status和hermes dump在这里很有用。hermes logs list会显示所有日志文件及其大小。hermes config path会输出配置文件位置。hermes config env-path会输出.env位置。⁶

常见问题

Hermes Agent和Claude Code有什么区别？

Claude Code是Anthropic的官方CLI，仅限于Anthropic模型。Hermes Agent是Nous Research推出的开源agent框架，可与任何OpenAI兼容提供商配合使用——Nous Portal、OpenRouter、Anthropic、GitHub Copilot、z.ai、Kimi、MiniMax、DeepSeek、Hugging Face、Google，或您自己的自托管端点。¹² Hermes还内置了Telegram/Discord/Slack/WhatsApp/Signal消息gateway，而Claude Code没有。

我可以用Anthropic API密钥使用Hermes吗？

可以。有3种方式：²

在~/.hermes/.env中设置ANTHROPIC_API_KEY，然后运行hermes chat --provider anthropic --model claude-sonnet-4-6
运行hermes model并选择Anthropic——可用时，Hermes会使用Claude Code的凭据存储
设置手动ANTHROPIC_TOKEN（setup-token或OAuth token）作为回退

如果您已在同一台机器上使用Claude Code，建议选择选项2——它能让可刷新的Claude凭据继续保持可刷新。

如何在不丢失对话的情况下切换提供商？

在会话内使用/model provider:model。对话历史、memory和skills都会保留：⁹

/model zai:glm-5
/model openrouter:anthropic/claude-sonnet-4
/model custom:local:qwen-2.5

我配置了Anthropic，但vision/web/compression无法工作

您遇到的是辅助模型回退。Vision、网页摘要、压缩和其他侧边任务会使用单独的辅助LLM——默认通过自动检测使用Gemini Flash（OpenRouter → Nous → Codex）。如果这些都没有配置，而您只设置了Anthropic，这些功能会静默降级。⁴

修复方法：添加用于辅助任务的OPENROUTER_API_KEY，或重新配置辅助槽位以使用您的主提供商。请注意，上下文压缩位于自己的顶级compression:块中，并使用summary_provider，而不是auxiliary.compression.provider——auxiliary.compression槽位只暴露timeout。完整修复如下：

auxiliary:
  vision:      { provider: "main" }
  web_extract: { provider: "main" }

compression:
  summary_provider: "main"

SOUL.md和AGENTS.md有什么区别？

SOUL.md是agent的身份设定——语气、风格、默认沟通方式。它位于~/.hermes/SOUL.md，会随您在各处使用。AGENTS.md是项目专属的——架构、约定、命令、路径——并位于您的项目目录中。¹³ 如果内容应随您在各处使用，就放在SOUL.md。如果内容属于某个项目，就放在AGENTS.md。

如何并排运行多个Hermes实例？

使用profile。每个profile都有自己的HERMES_HOME、配置、memory、会话和gateway PID：⁶

hermes profile create work --clone
hermes profile use work                 # Sticky default
hermes -p work chat -q "..."            # One-off without switching
hermes profile alias work --name h-work # Wrapper script

Hermes支持本地LLM吗？

支持，通过自定义端点路径实现。Hermes可与任何OpenAI兼容服务器配合使用：Ollama、vLLM、SGLang、llama.cpp/llama-server、LM Studio、LocalAI、Jan，或您自己的服务器。² 请参阅自定义和自托管端点，了解各服务器的设置方法。

为什么我的启动横幅显示的工具数量少于指南中说的Hermes拥有的数量？

指南引用的47个工具/20个toolsets来自上游架构注册表——这是Hermes在所有toolset中随源码提供的完整工具数量。正在运行的安装会在横幅中显示较小的数字（本指南使用的参考安装报告为28个工具），因为Hermes启动时只启用默认toolset集合。许多toolsets需要选择启用：消息gateway适配器、浏览器自动化、较重的抓取栈以及多个专用集成都必须在~/.hermes/config.yaml的toolsets:下显式列出后才会加载。注册表总数=“启用后可用的内容”。横幅总数=“当前profile实际加载的内容”。使用hermes tools --list查看哪些toolsets处于活动状态，以及哪些可用但已禁用。可在运行时使用/tools enable <name>和/tools disable <name>切换单个toolset（禁用会触发会话重置，以便agent用新的形态重建其工具清单）。

当主提供商失败时，Hermes如何处理模型回退？

在config.yaml中配置fallback_model块：²

fallback_model:
  provider: openrouter
  model: anthropic/claude-sonnet-4

当主提供商失败（速率限制、服务器错误、认证失败）时，Hermes会在会话中途切换到回退模型，而不会丢失对话历史。每个会话最多触发一次。

agent能否随着时间改进自己的skills？

可以——这正是Hermes Agent“自我改进”的部分。agent可以通过skill_manage工具创建、更新和删除skills。当它弄清楚一个重要工作流时，会将方法保存为skill，以便未来复用。¹¹ agent会在完成复杂任务（5次以上工具调用）、遇到错误并找到可行路径、您纠正其方法，或发现重要工作流后创建skills。

是否有IDE集成？

有——Hermes可以作为VS Code、Zed和JetBrains的ACP（Agent Client Protocol）服务器运行：⁶

pip install -e '.[acp]'
hermes acp

更新日志

日期	变更	来源
2026-07-01	指南v1.10：v0.18.0“The Judgment Release”（2026年7月1日，标签`v2026.7.1`）。新增“v0.18.0新增内容”章节：完整P0/P1待办积压已关闭（约692项）；Mixture-of-Agents成为一等功能，支持带标签的逐模型集成输出和实时流式传输；完成契约——`/goal`会通过运行项目检查来验证自身工作；`/learn`（描述工作流→可复用skill，符合CONTRIBUTING.md）；`/journey`记忆/skill时间线+桌面记忆图谱；后台subagent扇出（并发委派任务）；Desktop Projects（项目/repo/lane）；可缩至零的gateway，带耗尽协调；Google Vertex AI（通过GCP服务账号使用Gemini，自动刷新OAuth2）；`/prompt` \$EDITOR编辑器。来源：hermes-agent releases。	²²
2026-06-21	指南v1.9：v0.17.0“The Reach Release”（2026年6月19日，标签`v2026.6.19`）。新增“v0.17.0新增内容”章节。消息：通过Photon Spectrum实现无中继iMessage（`hermes photon login`、设备代码OAuth），官方WhatsApp Business Cloud API适配器（无需桥接），SimpleX群组+附件，Raft平台插件。模型：`z-ai/glm-5.2`（1M）、`anthropic/claude-fable-5`、`laguna-m.1`、`nemotron-3-ultra`、`grok-composer-2.5-fast`（xAI OAuth，200k）；xAI默认→`grok-build-0.1`；Anthropic自适应模型移除`reasoning`字段。桌面/dashboard：带实时观察窗口的后台subagent（`delegate_task(background=true)`）、完整profile构建器、重做的Skills Hub、Automation Blueprints、安全401登录、VS Code Marketplace主题、日语+繁体中文UI。Skills/tools：`image_generate`图生图编辑、`memory`原子`operations`批处理、`simplify-code` skill、布尔型`write_approval`（取代`write_mode`）。架构：MCP引导处理器、可插拔CronScheduler+Chronos、Managed作用域（`/etc/hermes`）、Gateway-Gateway中继。命令：`/version`、`/billing`、`hermes curator run --consolidate`（选择启用）。安全：shell转义拒绝列表绕过已修复、审批/gateway适配器失败即关闭、cron环境已净化、调试转储中密钥已脱敏、MCP stdio外泄筛查、urllib3+PyJWT CVE升级。	²¹
2026-06-08	指南v1.8：v0.16.0“The Surface Release”（2026年6月5日，标签`v2026.6.5`）。将指南标题改为v0.16，并新增“v0.16.0新增内容”章节。重点：Hermes不再只是终端工具。原生Hermes Desktop应用（Electron，macOS/Linux/Windows），支持一键安装、应用内自更新、流式聊天、拖放+剪贴板粘贴图片、`Cmd+K`命令面板、会话归档/搜索、状态栏模型选择器、通过安全WebSocket连接远程gateway（OAuth或用户名/密码，按profile配置主机，跨profile `@session`链接），并通过类型化i18n提供完整简体中文翻译。浏览器管理面板（web dashboard→完整管理）：MCP目录启用/禁用、凭据管理、webhook/hook创建、记忆配置、gateway控制、带更新前检查+Debug Share的System页面、新Channels页面，以及可插拔认证（用户名/密码、自托管OIDC、`hermes dashboard register`）。新命令：`/undo [N]`（CLI/TUI/消息）、可配置默认界面（`cli`/`tui`、`--cli`）、TUI统一`/model`+Sessions浮层、`hermes portal`、`hermes prompt-size`、`hermes sessions optimize`。新模型：`deepseek-v4-flash`、`MiniMax-M3`（1M上下文）、`qwen3.7-plus`、`gemini-3.5-flash`；桌面启动器中的一等xAI Grok OAuth；模糊模型选择器；每小时刷新目录。Skills：更精简的默认集合（Spotify→原生插件，Linear→`hermes mcp install linear`，移除失效skills）、`environments:`相关性门控（`kanban`/`docker`/`s6`）、`NVIDIA/skills`默认可信tap、渐进式（限定作用域）MCP/插件工具披露。安全：CVE-2026-48710（Starlette BadHost）固定为≥1.0.1；SSRF检查移出事件循环；从子进程env中剥离Bedrock bearer token；`bws_cache.json`增加读取保护；将`docker restart/stop/kill`加入危险模式；不可见Unicode净化。关闭2个P0+62个P1（其中16个带安全标签）。	²⁰
2026-05-31	指南v1.7.1：v0.15.1（2026年5月29日，01:12 UTC）——Velocity补丁。Velocity发布当天热修复；固定标签`v2026.5.29`线。修复影响loopback模式部署的dashboard 401重载循环。Docker不再将`--insecure`视为隐式启用——需显式设置`HERMES_DASHBOARD_INSECURE=1`才能重新选择启用。MCP裸命令（`npx`、`npm`、`node`）再次可在Docker容器内正确解析。Skills页面的来源胶囊和分类侧边栏可正常渲染。Kanban worker会干净响应SIGTERM，不再遗留孤立进程。Skills.sh目录通过sitemap发现从858项扩展到19,932项。28次提交、21个合并PR、9位贡献者。v0.15.2（2026年5月29日，13:37 UTC）——Velocity打包补丁。修复wheel和sdist发行包，使其捆绑`plugin.yaml`清单，从而可直接从PyPI安装，无需旁加载源代码树。仅打包热修复，4位贡献者。	²³
2026-05-28	指南v1.7：新增v0.15.0（2026年5月28日）——The Velocity release（标签`v2026.5.28`）。重点：一次大规模重构+新的编排原语。代码库重构：`run_agent.py`减少76%（16,083→3,821行），分布到14个职责内聚的模块中。Multi-agent Kanban v2：将高层目标自动分解为子任务、用于并行worker协调的swarm拓扑、按任务覆盖模型、计划任务、worktree管理。性能：冷启动再节省1秒；每轮对话函数调用减少47%；`session_search`重新设计后快4,500倍，移除LLM依赖（并消除其API成本）。安全：Promptware防御在3个安全关口抵御Brainworm类提示注入；Bitwarden Secrets Manager集成以单个bootstrap token取代多个按provider配置的API密钥。Skill bundles：用一个slash command同时加载多个skills。TUI会话编排器：在单个终端窗口内管理多会话。新provider：Krea 2（Medium/Large）和用于图像生成的FAL插件支持；xAI集成轮次增加web搜索插件、OAuth上游、退役模型检测和自然TTS停顿。统计：1,302次提交、747个合并PR、321位社区贡献者。根据GitHub发布说明，同日或次日补丁版本解决dashboard 401重载循环、Docker `--insecure`显式env变量、MCP裸命令在Docker中的解析（`npx`、`npm`、`node`）、Skills页面恢复、Kanban worker SIGTERM处理，以及通过sitemap提供完整19,932项Skills目录。	²⁴
2026-05-21	指南v1.6：新增v0.14.0（2026年5月16日）——The Foundation release。重点：更轻的安装/运行时基础，以及更广的provider、gateway、媒体和验证表面。新增SuperGrok OAuth，带grok-4.3 1M上下文；面向OAuth provider的OpenAI兼容`hermes proxy`；一等`x_search`；`pip install hermes-agent`；懒依赖安装；启动快约19秒；浏览器CDP调用快180倍；LINE+SimpleX Chat，使消息平台达到22个；Microsoft Teams端到端；`/handoff`；`/subgoal`；Telegram/Discord上的原生澄清按钮；Discord历史回填；原始像素`vision_analyze`；每轮文件变更验证器页脚；每次写入时执行LSP语义诊断；统一`video_generate`；通过cua-driver为非Anthropic provider提供`computer_use`；OSC8可点击URL；Zed ACP Registry支持；OpenRouter Pareto Code路由器；NovitaAI；Codex app-server运行时；`huggingface/skills`可信tap；9个可选skills；插件`ctx.llm`/`tool_override`；Brave/DDGS web搜索；Qwen Cloud改名；原生Windows beta；以及12个P0/50个P1关闭。	¹⁹
2026-05-07	指南v1.5：新增v0.13.0（2026年5月7日）——The Tenacity release。重点：一个持久的multi-agent Kanban board（心跳、回收、僵尸检测、幻觉门控、按任务`max_retries`、多项目看板），将swarm从委派模式提升为一等原语。`/goal`命令让agent跨轮次锁定目标（将Ralph-loop模式作为slash command）。新增`video_analyze`工具，Gemini优先，并支持可扩展的兼容模型。xAI Custom Voices TTS provider，支持声音克隆。7语言i18n（zh-Hans、ja、de、es、fr、uk、tr），用于CLI和gateway消息；文档仅zh-Hans。Google Chat作为第20个消息平台，通过可插拔适配器模式接入；IRC+Microsoft Teams迁移到同一模式。`ProviderProfile` ABC+`plugins/model-providers/`，允许可插拔第三方provider，无需修改核心。会话自动恢复覆盖gateway重启、`/update`和源文件重载。Checkpoints v2重写，采用单存储设计、真实修剪和磁盘护栏。8个P0安全关闭：默认开启密钥脱敏、Discord跨guild DM绕过（CVSS 8.1）、WhatsApp陌生人拒绝+自聊静音、MCP OAuth TOCTOU、CLI `auth.json` TOCTOU、浏览器SSRF底线、cron提示注入扫描、`hermes debug share`脱敏。写入后lint覆盖Python/JSON/YAML/TOML，cron `no_agent`纯脚本模式，Slack/Telegram/Mattermost/Matrix/DingTalk的平台allowlist，MCP增强（SSE传输、OAuth转发、图片MEDIA标签）。自v0.12.0以来统计：864次提交、588个合并PR、829个文件变更、295位社区贡献者、282个issue关闭（13个P0、36个P1）。	¹⁸
2026-05-06	指南v1.4：新增v0.12.0（2026年4月30日）——The Curator release。重点：一个在gateway的cron ticker上运行的自主后台Curator（默认7天周期），按评分标准评估skill库、修剪失效skills、合并相关skills，并写入每次运行报告——Hermes会在活跃会话之间自我维护。自我改进循环升级，加入基于评分标准的评估、活跃更新偏置、正确的运行时继承，以及仅限记忆和skills的限定toolsets。4个新推理provider：GMI Cloud、Azure AI Foundry、MiniMax OAuth和Tencent Tokenhub。LM Studio提升为一等功能。远程模型目录清单现在无需发布即可自动更新。2个新消息平台：Microsoft Teams（第19个，通过可插拔gateway架构）和Tencent Yuanbao（第18个，原生文本+媒体）。原生Spotify通过PKCE OAuth并捆绑skill；Google Meet插件用于通话和转录；Piper本地TTS provider。ComfyUI v5+TouchDesigner-MCP从可选移为默认捆绑。新skills：Humanizer、claude-design、design-md、airtable。CLI新增：`hermes -z`一次性模式、`hermes update --check`预检、`/reload-skills` slash command、可插拔忙碌指示器样式。通过懒agent初始化和懒导入，可见TUI冷启动缩短约57%。安全：默认禁用密钥脱敏，以防payload损坏；针对不可恢复命令的强硬阻止列表。统计：1,096次提交、550个合并PR、213位社区贡献者。	¹⁷
2026-04-25	指南v1.3：新增v0.11.0（2026年4月23日）——The Interface release。对交互式TUI进行完整React/Ink重写，配备Python JSON-RPC后端（`tui_gateway`）；固定composer、实时流式传输并支持OSC-52剪贴板、稳定选择器按键、带每轮秒表和git分支的状态栏、`/clear`确认、浅色主题预设、subagent生成可观测性浮层。可插拔传输架构——格式转换和HTTP传输抽取到`agent/transports/`，让provider管线更清爽。通过Converse API支持原生AWS Bedrock。5条新推理路径：NVIDIA NIM、Arcee AI、Step Plan、Google Gemini CLI OAuth和Vercel ai-gateway。通过Codex OAuth使用GPT-5.5——新的OpenAI旗舰模型现在可通过ChatGPT Codex OAuth访问，无需单独的API密钥。QQBot（第17个消息平台），支持扫码设置和流式传输。插件表面扩展：slash commands、工具分发、执行阻断、结果转换。`/steer <prompt>`——运行中agent微调，会注入一条注释，运行中的agent在下一次工具调用后看到；不打断当前轮次，也不破坏提示缓存。Shell hooks将脚本接为生命周期hooks，无需Python插件。Webhook直送模式将payload直接转发到平台聊天，绕过agent进行扇出。更智能的委派，支持编排器角色、可配置生成深度和文件协调。Dashboard获得插件系统、实时主题切换、i18n和移动端响应式。自v0.9.0以来统计：1,556次提交、761个合并PR、1,314个文件变更、224,174行插入、29位社区贡献者。	²⁵
2026-04-16	指南v1.2：新增v0.10.0——Nous Tool Gateway。付费Nous Portal订阅者现在可以访问托管工具（Firecrawl web搜索、FAL/FLUX 2 Pro图像生成、OpenAI TTS、Browser Use浏览器自动化），无需额外API密钥。通过新的`use_gateway`配置字段按工具选择启用。当同时配置gateway和直接API密钥时，运行时优先使用gateway。移除`HERMES_ENABLE_NOUS_MANAGED_TOOLS`环境变量。Hermes Agent CLI仍采用MIT许可，并且完全免费。	²⁶
2026-04-13	指南v1.1：新增v0.8.0和v0.9.0功能。本地web dashboard、`/fast`模式、iMessage+WeChat平台（共16个）、后台进程监控（`watch_patterns`）、可插拔context engine、`hermes backup`/`hermes import`、Termux/Android、xAI+MiMo+Google AI Studio+Qwen providers、`/debug`命令、全面安全加固。	¹⁵ ¹⁶
2026-04-10	指南v1.0：首次发布，覆盖Hermes Agent v0.7.0。Provider认证、配置、CLI、slash commands、工具、skills、记忆、gateway、cron、MCP、压缩、架构、OpenClaw迁移、故障排除、FAQ。

参考资料

Nous Research，“Hermes Agent”项目 README，位于GitHub。这是产品描述（自我改进型代理、多提供商、消息 gateway、终端后端、skill 演进、cron 调度器、委派）以及“快速安装”单行命令的主要来源。 ↩↩↩
Nous Research，Hermes Agent 文档中的“AI Providers”。这是完整提供商列表、各提供商认证方式（Nous Portal OAuth、Codex 设备码、GitHub Copilot 令牌类型、Anthropic 三种认证方式、中国 AI 提供商、Hugging Face 路由、自定义端点）、三条认证路径（.env中的API key、通过hermes model使用OAuth、config.yaml中的自定义端点）、/model斜杠命令语法（包括custom:name:model）、Ollama/vLLM/SGLang/llama.cpp/LM Studio 设置模板、WSL2 网络说明、上下文长度检测链、后备模型配置、智能模型路由以及命名自定义提供商的主要来源。本文中所有提供商专属环境变量名、令牌类型、base URL 覆盖项和模型标识符均来自此页面。 ↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩
Nous Research，Hermes Agent 开发者指南中的“Architecture”。这是系统总览图、目录结构、通过CLI会话和 gateway 消息路径的数据流、三种API模式（chat_completions、codex_responses、anthropic_messages）、通过runtime_provider.py进行的提供商解析、通过 SQLite + FTS5 实现的会话持久化、消息 gateway 平台列表、插件系统发现来源、profile 隔离以及六项设计原则的主要来源。 ↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩
Nous Research，Hermes Agent 用户指南中的“Configuration”。这是配置目录结构、config.yaml与.env规则（“config.yaml wins for non-secret settings”）、配置优先级链（CLI args → env → config.yaml → .env → defaults）、上下文压缩设置（包含threshold、target_ratio、protect_last_n、summary_model、summary_provider、summary_base_url的compression.*块）、预算压力阈值（70%提醒、90%警告）、本地提供商自动调整的流式超时，以及完整辅助模型配置块（auxiliary:下的vision、web_extract、approval、compression、session_search、skills_hub、mcp、flush_memories槽位）的主要来源。"main"提供商仅限辅助/压缩/后备槽位的限制也来自此页面。 ↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩
Nous Research，Hermes Agent 指南中的“Migrate from OpenClaw”。这是 OpenClaw → Hermes 迁移流程的来源。 ↩↩
Nous Research，Hermes Agent 参考文档中的“CLI Commands Reference”。这是本文记录的每个顶层CLI命令的主要来源，包括hermes chat、hermes model、hermes gateway、hermes setup、hermes auth、hermes status、hermes cron、hermes webhook、hermes doctor、hermes dump、hermes logs、hermes config、hermes pairing、hermes skills、hermes honcho、hermes memory、hermes acp、hermes mcp、hermes plugins、hermes tools、hermes sessions、hermes insights、hermes claw、hermes profile、hermes completion、hermes update和hermes uninstall。本文中的所有子命令标志、选项说明、凭据池行为、日志过滤语法、OpenClaw 迁移标志、profile 管理命令和服务安装命令均来自此页面。 ↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩
Nous Research，Hermes Agent 入门指南中的“Installation”。这是单行安装器命令、安装器行为（先决条件、平台支持、Termux 自动检测、Windows/WSL2 要求）、可选 extras 表、手动安装步骤和验证命令的主要来源。 ↩↩↩↩↩↩↩
Nous Research，“CLI Commands Reference”——尤其参见hermes dump部分，其中说明了该命令的输出格式（头部、环境、身份、模型、终端、API keys、功能、服务、工作负载、配置覆盖）以及用于共享诊断信息的预期用途。 ↩
Nous Research，Hermes Agent 参考文档中的“Slash Commands Reference”。这是本文列出的每个斜杠命令、COMMAND_REGISTRY架构、CLI与消息侧的拆分、动态 skill 斜杠命令、config.yaml中的快捷命令、前缀匹配行为，以及仅限消息侧命令（/status、/sethome、/approve、/deny、/update、/commands）的主要来源。 ↩↩↩↩↩↩↩↩↩↩
Nous Research，Hermes Agent 用户指南中的“Tools & Toolsets”。这是工具类别概览、toolset 使用命令、六种终端后端（local、docker、ssh、singularity、modal、daytona）、容器配置（cpu、memory、disk、persistent）、容器安全加固、后台进程管理API以及 sudo 支持的主要来源。 ↩↩↩↩↩↩↩↩↩↩
Nous Research，Hermes Agent 用户指南中的“Skills System”。这是渐进式披露、SKILL.md格式、平台专属 skills、条件激活（fallback_for_toolsets、requires_toolsets、fallback_for_tools、requires_tools）、通过skill_manage实现的代理托管 skills、skill hub 命令和来源列表（official、skills-sh、well-known、github、clawhub、claude-marketplace、lobehub）、安全扫描与信任级别，以及外部 skill 目录的主要来源。 ↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩
Nous Research，Hermes Agent 用户指南中的“Persistent Memory”。这是MEMORY.md/USER.md字符限制、冻结快照模式、memory 工具操作（add、replace、remove）、应保存与应跳过的内容、memory 与 session search 对比，以及八个外部 memory 提供商列表（Honcho、OpenViking、Mem0、Hindsight、Holographic、RetainDB、ByteRover、Supermemory）的主要来源。 ↩↩↩↩↩↩↩↩
Nous Research，Hermes Agent 用户指南中的“Personality & SOUL.md”。这是SOUL.md行为（位于HERMES_HOME、永不覆盖、系统提示中的第 1 槽位、纳入前会进行安全扫描）、SOUL.md 与 AGENTS.md 区别、内置 personality 列表（从helpful到hype的 14 种 personality）、config.yaml中的自定义 personalities、/personality叠加模式，以及完整提示栈组装顺序的主要来源。 ↩↩↩↩↩↩↩↩↩↩↩↩
Nous Research，Hermes Agent 指南与参考中的“Use MCP with Hermes”和MCP Config Reference。这是config.yaml中带有command、args、env字段的mcp_servers:配置格式来源。 ↩
Hermes Agent v0.8.0 Release Notes。2026年4月8日。后台进程自动通知、Nous Portal 上免费 MiMo v2 Pro、跨平台实时/model切换、Google AI Studio 原生提供商、Qwen OAuth、基于不活动状态的超时、Slack/Telegram 上的批准按钮、MCP OAuth 2.1 PKCE、集中式日志、插件系统扩展。 ↩↩↩↩↩
Hermes Agent v0.9.0 Release Notes。2026年4月13日。本地 Web dashboard、Fast Mode（/fast）、通过 BlueBubbles 使用 iMessage、WeChat + WeCom、Termux/Android、后台进程监控（watch_patterns）、xAI + Xiaomi MiMo 原生提供商、可插拔 context engine、统一代理支持、安全加固（路径遍历、shell 注入、SSRF、RCE 修复）、hermes backup/hermes import、/debug + hermes debug share、16 个受支持平台。487 次提交、269 个合并 PR、24 位贡献者。 ↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩
Hermes Agent v0.12.0 Release Notes。2026年4月30日。“The Curator release.”自主后台 Curator 会在 gateway 的 cron ticker 上以默认 7 天周期对 skill library 进行评分、修剪和整合。自我改进循环升级：基于 rubric 的评分、主动更新偏向、正确的运行时继承、限定 toolsets 仅限 memory 和 skills。4 个新的推理提供商：GMI Cloud、Azure AI Foundry、MiniMax OAuth、Tencent Tokenhub。LM Studio 升级为一等公民。远程模型目录 manifests 无需发布即可自动更新。2 个新的消息平台：Microsoft Teams（第 19 个，通过可插拔 gateway 架构）和 Tencent Yuanbao（第 18 个，原生文本 + 媒体）。原生 Spotify 通过 PKCE OAuth并附带 skill；Google Meet 插件用于通话和转录；Piper 本地 TTS 提供商。ComfyUI v5 + TouchDesigner-MCP默认随附。新 skills：Humanizer、claude-design、design-md、airtable。CLI：hermes -z一次性模式、hermes update --check预检、/reload-skills斜杠命令、可插拔忙碌指示器样式。通过惰性初始化将 TUI 冷启动缩短约 57%。安全：默认禁用密钥脱敏；针对不可恢复命令的硬性阻止列表。自 v0.11.0 以来统计：1,096 次提交、550 个合并 PR、213 位社区贡献者。另请参见：v2026.4.30 release tag。 ↩↩↩
Hermes Agent v0.13.0 Release Notes。2026年5月7日。“The Tenacity release.”带 heartbeat、reclaim、zombie detection、hallucination gate、每任务max_retries和多项目 boards 的多代理 Kanban board。用于跨轮次目标锁定的/goal斜杠命令（Ralph loop primitive），可配置轮次预算。video_analyze工具，Gemini 优先，并具备兼容的多模态扩展能力。xAI Custom Voices TTS 提供商，支持语音克隆。7 语言 i18n：zh-Hans、ja、de、es、fr、uk、tr（CLI + gateway 消息；文档仅 zh-Hans）。Google Chat 作为第 20 个消息平台，通过可插拔适配器模式以及通用env_enablement_fn/cron_deliver_env_var插件钩子接入；IRC 和 Microsoft Teams 迁移到同一模式。ProviderProfile ABC + plugins/model-providers/用于可插拔第三方提供商。gateway 重启、/update和源文件重新加载后会话自动恢复。Checkpoints v2 单存储重写，具备真实修剪、磁盘护栏且无孤立 shadow repos。8 项 P0 安全关闭：密钥脱敏默认开启、Discord 跨 guild DM 绕过（CVSS 8.1，角色 allowlists 按 guild 限定）、WhatsApp 默认拒绝陌生人 + 永不在 self-chat 中响应、MCP OAuth credential-save TOCTOU、CLI凭据写入器中的auth.json TOCTOU、混合路由中的浏览器云元数据 SSRF 底线、cron 组装提示扫描（包括 skill 内容）以防提示注入、hermes debug share上传时日志内容脱敏。其他值得注意的项目：Python/JSON/YAML/TOML 写后 lint、cron no_agent仅脚本 watchdog 模式、Slack/Telegram/Mattermost/Matrix/DingTalk 跨平台 allowlists、MCP增强（SSE 传输、OAuth转发、图像结果作为 MEDIA 标签）。自 v0.12.0 以来统计：864 次提交、588 个合并 PR、829 个文件变更、295 位社区贡献者、282 个 issue 关闭（13 个 P0、36 个 P1）。 ↩↩↩↩↩↩↩↩↩↩↩↩
Hermes Agent v0.14.0 Release Notes。2026年5月16日。“The Foundation release.”自 v0.13.0 以来：808 次提交、633 个合并 PR、1,393 个文件变更、165,061 次插入、545 个 issue 关闭（12 个 P0、50 个 P1）以及 215 位社区贡献者。新增带有 grok-4.3 1M 上下文的 SuperGrok OAuth、hermes proxy、x_search、PyPI 打包、惰性依赖、跨会话 1 小时Claude提示缓存、启动加快约 19 秒、浏览器 CDP 调用快 180 倍、LINE 和 SimpleX Chat（消息平台增至 22 个）、/handoff、原生澄清按钮、Discord 历史回填、raw-pixel vision_analyze、每轮文件变更验证器页脚、LSP 语义诊断、统一video_generate、cua-driver computer_use、OSC8 链接、Zed ACP Registry 支持、OpenRouter Pareto Code router、NovitaAI、Codex app-server runtime、huggingface/skills、插件ctx.llm、tool_override、Brave/DDGS 搜索、危险命令加固、/subgoal、Qwen Cloud 重命名、原生 Windows beta、总计 16 个 locale，以及广泛的文档/测试更新。 ↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩
Hermes Agent v0.16.0 release notes，“The Surface Release”，标签v2026.6.5，发布于 2026-06-06T00:55:58Z（release-tag 日期为 2026年6月5日）；截至 2026-06-08 为最新版本。新增原生 Hermes Desktop（Electron，macOS/Linux/Windows；通过安全WebSocket使用OAuth或用户名/密码连接远程 gateway；按 profile 配置远程主机；跨 profile @session链接；通过类型化 i18n 和display.language提供简体中文 UI）。Web dashboard 扩展为完整管理面板（MCP目录开关、凭据管理、webhook/hook 创建、memory 配置、gateway 控制、带更新前检查 + Debug Share 的 System 页面、Channels 页面；可插拔认证，包括自托管 OIDC 和hermes dashboard register）。新命令：/undo [N]、可配置默认界面（cli/tui、--cli）、TUI /model + Sessions 覆盖层、hermes portal、hermes prompt-size、hermes sessions optimize。新模型：deepseek-v4-flash、MiniMax-M3（1M 上下文）、qwen3.7-plus、gemini-3.5-flash；xAI Grok OAuth；模糊选择器；每小时目录刷新。Skills：更精简的默认集合、environments:相关性门控、NVIDIA/skills默认受信任 tap、渐进式工具披露、MCP false-OAuth-success 修复。安全：CVE-2026-48710（Starlette BadHost）固定为 ≥1.0.1、SSRF 检查移出事件循环、Bedrock bearer token 从子进程 env 中剥离、bws_cache.json读取受保护、docker restart/stop/kill加入危险模式、不可见 Unicode 清理；关闭 2 个 P0 + 62 个 P1（16 个带 security 标签）。已排除发布说明中的营销表述（PR/提交数量、“none of this existed a week ago”）；仅记录与该标签相关的具体功能/版本事实。当前会话验证日期：2026年6月8日。 ↩↩↩↩↩↩↩↩
Hermes Agent v0.17.0 release notes，“The Reach Release”，标签v2026.6.19，2026年6月19日；截至 2026-06-21 为最新版本。消息：通过 Photon Spectrum 使用 iMessage（设备码OAuth、hermes photon login、无需 Mac relay）；官方 WhatsApp Business Cloud API适配器（替代 bridge 进程）；SimpleX 群组、原生附件、文本批处理、自动接受；Raft 捆绑平台插件。模型/提供商：z-ai/glm-5.2（1M 上下文）、anthropic/claude-fable-5、laguna-m.1、nemotron-3-ultra、grok-composer-2.5-fast（xAI OAuth、200k 上下文）；xAI 默认 → grok-build-0.1；Anthropic自适应模型使用现代 thinking contract（无reasoning字段）。CLI/斜杠：/version、/billing、hermes photon login、hermes curator run --consolidate（选择启用）、hermes model GUI、profile 克隆。Desktop：后台 subagent watch-windows（delegate_task(background=true)）、Composer 模型选择器、可重新绑定快捷键、原生 OS 通知、按线程保存草稿、VS Code Marketplace 主题、日语 + 繁体中文 UI。Dashboard：完整 profile builder、全局 profile switcher、Skills Hub 重做并含安全扫描、Automation Blueprints、安全登录（OAuth后返回 401）。Skills/tools：跨提供商的image_generate图生图编辑、memory operations原子批处理、simplify-code并行 review skill、布尔write_approval替代write_mode。架构：后台 subagents（立即返回 handle，结果作为一个 turn 重新进入）、MCP elicitation handler 用于工具调用中的确认、迟连接的MCP工具在轮次之间暴露、可插拔 CronScheduler + Chronos 托管 cron、Managed scope（/etc/hermes管理员固定）、Gateway-Gateway relay。安全：关闭 shell-escape denylist 绕过、缺少 approval module 和 own-policy gateway adapters 时 fail-closed、cron job-script env 清理、debug dumps 中密钥脱敏、公共 status 隐藏主机元数据、MCP stdio 外泄模式筛查、urllib3 + PyJWT CVE 升级。已排除发布营销表述（提交/PR 数）。当前会话验证日期：2026年6月21日。 ↩↩↩↩↩↩↩↩↩↩↩
Hermes Agent v0.18.0 release notes（标签v2026.7.1），2026年7月1日——“The Judgment Release.”优先级 backlog 清扫（所有 P0/P1 均已关闭，12 天内约 692 项）；Mixture-of-Agents 作为一等模型可在所有界面中选择，每个参考模型的完整输出会渲染为独立标注块并进行实时答案流式输出；/goal的完成契约（代理通过运行项目检查来验证自身工作）；/learn命令（通过描述将任何内容变成可复用 skill，并自动遵守 CONTRIBUTING.md）；/journey可视化 memory/skill 时间线，带编辑功能和 desktop memory graph；后台 subagent 扇出（多个并发委派任务）；Desktop Projects（project/repo/lane 模型）；带 drain 协调的 scale-to-zero gateway；Google Vertex AI 支持（通过 GCP 服务账号使用 Gemini，自动OAuth2 令牌刷新）；/prompt $EDITOR 命令。当前会话验证日期：2026年7月1日（PST），依据GitHub releases 页面；v0.18.0 是最新版本。 ↩↩↩↩↩↩↩↩↩↩↩
Hermes Agent v0.15.1 release notes和Hermes Agent v0.15.2 release notes。v0.15.1（2026年5月29日 01:12 UTC）是同日 Velocity 热修复：修复 loopback 模式下 dashboard 401 reload-loop；Docker现在需要显式设置HERMES_DASHBOARD_INSECURE=1；MCP裸命令（npx、npm、node）可在Docker容器中解析；恢复 Skills 页面 source pills + category sidebar；Kanban workers 响应 SIGTERM；Skills.sh 目录通过 sitemap 从 858 条增长到 19,932 条。28 次提交、21 个合并 PR、9 位贡献者。v0.15.2（2026年5月29日 13:37 UTC）是仅打包相关的热修复，将plugin.yaml manifests 打包进 wheel 和 sdist 发行版，使 PyPI 安装无需旁加载源码即可工作。4 位贡献者。 ↩
Hermes Agent v0.15.0 release notes和Hermes Agent releases page。“The Velocity release”，标签v2026.5.28。统计：1,302 次提交、747 个合并 PR、321 位社区贡献者。重构run_agent.py 76%（跨 14 个模块从 16,083 行降至 3,821 行）。新增多代理 Kanban 平台（自动拆解、swarm topology、每任务模型覆盖、计划任务、worktree 管理）。session_search重新设计，速度提升 4,500 倍，并移除LLM依赖。针对 Brainworm 类提示注入的 Promptware 防御，覆盖三个安全关口。Bitwarden Secrets Manager 集成用单个 bootstrap token 替代多个按提供商配置的API keys。Skill bundles 允许通过一个斜杠命令加载多个 skills。TUI 会话编排器用于在一个终端窗口中管理多会话。Krea 2（Medium/Large）和 FAL 插件支持图像生成。xAI 集成轮次新增 Web 搜索插件、上游OAuth、退役模型检测，以及语音输出中的自然 TTS 停顿。GitHub上提到的一个补丁版本处理了 dashboard 401 reload-loop、Docker --insecure需要显式HERMES_DASHBOARD_INSECURE=1环境变量、MCP裸命令（npx、npm、node）在Docker中的解析、Skills 页面渲染、Kanban worker SIGTERM 处理、通过 sitemap 提供完整 19,932 条 Skills 目录，以及一小批.md交付、gateway probe 安全、Web URL 脱敏、kanban-worker vision 能力和 hindsight observation 默认值问题。 ↩
Hermes Agent v0.11.0 Release Notes。2026年4月23日。“The Interface release”——交互式CLI全面以 React/Ink 重写，并使用Python JSON-RPC 后端（tui_gateway）；可插拔传输架构（agent/transports/）；通过 Converse API原生支持 AWS Bedrock；5 条新推理路径（NVIDIA NIM、Arcee AI、Step Plan、Google Gemini CLI OAuth、Vercel ai-gateway）；通过 Codex OAuth支持 GPT-5.5；QQBot 作为第 17 个消息平台，支持扫码设置；扩展插件表面（斜杠命令、工具调度、执行阻止、结果转换）；/steer <prompt>用于中途引导代理，在下一个工具调用后注入上下文且不破坏提示缓存；无需Python插件的生命周期事件 shell hooks；webhook direct-delivery 模式会将 payload 直接转发到平台聊天；更智能的委派，具备 orchestrator roles + 可配置 spawn depth + 文件协调；dashboard 插件系统、实时主题切换、i18n、移动端响应式。自 v0.9.0 以来统计：1,556 次提交 · 761 个合并 PR · 1,314 个文件变更 · 224,174 次插入 · 29 位社区贡献者。另请参见：Hermes Agent v0.11.0 GitHub release tag。 ↩↩↩
Hermes Agent v0.10.0 Release Notes。2026年4月16日。“The Tool Gateway Release.”面向付费 Nous Portal 订阅者的 Nous Tool Gateway 集成——无需额外API keys，即可托管访问 Firecrawl Web 搜索、FAL / FLUX 2 Pro 图像生成、OpenAI TTS 和 Browser Use 浏览器自动化。通过新的use_gateway配置字段按工具选择启用。运行时在 gateway 和直接API keys 均已配置时优先使用 gateway。与hermes tools和hermes status完整集成。替换已弃用的HERMES_ENABLE_NOUS_MANAGED_TOOLS环境变量。由 @jquesnelle（emozilla）实现。Hermes Agent CLI仍采用 MIT 许可证并完全开源；gateway 是与现有 Portal 订阅产品的集成，并非对CLI设置付费墙。另请参见：Nous Portal了解订阅价格和注册。 ↩↩↩