How do I sign into a different AI provider in Hermes Agent?

Hermes has three auth paths. Path 1: API key in ~/.hermes/.env for providers like OpenRouter, z.ai, Kimi, MiniMax, DeepSeek, Hugging Face, and Google. Path 2: OAuth via hermes model or hermes auth for Nous Portal, OpenAI Codex, GitHub Copilot, and Anthropic — credentials are stored in ~/.hermes/auth.json. Path 3: custom endpoint in config.yaml for any OpenAI-compatible server like Ollama, vLLM, SGLang, llama.cpp, or LM Studio. Run hermes model interactively to walk through all options.

Can I run Hermes Agent with a local LLM like Ollama or vLLM?

Yes. Hermes works with any OpenAI-compatible API endpoint — Ollama, vLLM, SGLang, llama.cpp, LM Studio, LocalAI, Jan, or your own server. Run hermes model, select Custom endpoint, enter the base URL (e.g., http://localhost:11434/v1 for Ollama) and model name. Hermes handles context length detection automatically, but watch out for low defaults on Ollama (4k) and LM Studio (2048) — raise to at least 16k-32k for agent use.

What is SOUL.md and how does it relate to AGENTS.md?

SOUL.md is the agent's primary identity — tone, voice, communication style, personality-level behavior. It lives at ~/.hermes/SOUL.md and occupies slot #1 in every system prompt. AGENTS.md is project-specific — architecture, conventions, commands, paths — and lives in your project directory. The rule: if it should follow you everywhere, it belongs in SOUL.md. If it belongs to a project, it belongs in AGENTS.md.

hermes@agent:~/.hermes$ cat hermes.md

██╗  ██╗███████╗██████╗ ███╗   ███╗███████╗███████╗       █████╗  ██████╗ ███████╗███╗   ██╗████████╗
██║  ██║██╔════╝██╔══██╗████╗ ████║██╔════╝██╔════╝      ██╔══██╗██╔════╝ ██╔════╝████╗  ██║╚══██╔══╝
███████║█████╗  ██████╔╝██╔████╔██║█████╗  ███████╗█████╗███████║██║  ███╗█████╗  ██╔██╗ ██║   ██║
██╔══██║██╔══╝  ██╔══██╗██║╚██╔╝██║██╔══╝  ╚════██║╚════╝██╔══██║██║   ██║██╔══╝  ██║╚██╗██║   ██║
██║  ██║███████╗██║  ██║██║ ╚═╝ ██║███████╗███████║      ██║  ██║╚██████╔╝███████╗██║ ╚████║   ██║
╚═╝  ╚═╝╚══════╝╚═╝  ╚═╝╚═╝     ╚═╝╚══════╝╚══════╝      ╚═╝  ╚═╝ ╚═════╝ ╚══════╝╚═╝  ╚═══╝   ╚═╝

Hermes Agent: referência prática (2026)

Q: What is Hermes Agent and how is it different from Claude Code?

Hermes Agent is an open-source self-improving AI agent from Nous Research. Unlike Claude Code which is locked to Anthropic models, Hermes works with any OpenAI-compatible provider — Nous Portal, OpenRouter, Anthropic, GitHub Copilot, z.ai, Kimi, MiniMax, DeepSeek, Hugging Face, Google, or your own self-hosted endpoint. Hermes also ships a messaging gateway for Telegram, Discord, Slack, WhatsApp, Signal, and more that Claude Code does not have.

Q: How do I switch models mid-conversation without losing history?

Use /model provider:model inside an active session. Hermes persists the conversation, memory, and skills across the switch. Examples: /model zai:glm-5, /model openrouter:anthropic/claude-sonnet-4, /model custom:local:qwen-2.5 for a named custom provider. /model custom with no model name auto-detects the model from a local endpoint's /v1/models API.

# Uma referência prática sobre o Hermes Agent, o agente de IA open-source da Nous Research que se autoaprimora: autenticação de provedores e OAuth, arquivos de configuração, sistema de skills e como executá-lo como um gateway de mensagens multiplataforma.

words: 18287 read_time: 70m updated: 2026-07-02 14:57

$ less hermes.md

Resumo: Hermes Agent é um agente de IA open-source e autoaprimorável da Nous Research. Ele roda como CLI e como um gateway de mensagens multiplataforma, armazena uma identidade durável e memória persistente em disco, agrega skills que melhoram com o uso e funciona com qualquer provedor LLM compatível com OpenAI — Nous Portal, OpenRouter, Anthropic, GitHub Copilot, z.ai, Kimi, MiniMax, DeepSeek, Qwen Cloud, Hugging Face, Google, xAI/SuperGrok ou seu próprio endpoint auto-hospedado.¹²¹⁹ A partir da v0.14.0 (16 de maio de 2026), Hermes adiciona SuperGrok OAuth com contexto de 1M do grok-4.3, um proxy local compatível com OpenAI para provedores OAuth (hermes proxy), x_search de primeira classe, suporte a instalação via PyPI, instalação preguiçosa de dependências, 22 plataformas de mensagens com LINE e SimpleX Chat, /handoff, diagnósticos semânticos LSP após escritas, video_generate unificado, computer_use via cua-driver para provedores que não são Anthropic, beta nativo para Windows e fechamento de 12 P0 / 50 P1.¹⁹ A parte mais difícil para a maioria dos novos usuários é a autenticação de provedores: Hermes oferece suporte a cerca de 20 provedores de primeira classe, além de endpoints personalizados, e três caminhos distintos de autenticação (chave API em .env, OAuth via hermes model ou endpoint personalizado em config.yaml). O modelo de autenticação é a primeira coisa que você deve aprender — todo o resto depende de qual provedor é resolvido.

Hermes Agent opera como um runtime completo de agente, não como um wrapper de chat. Ele lê seu filesystem, executa comandos em backends com sandbox, faz scraping da web, cria subagents, executa cron jobs agendados, conversa com Telegram/Discord/Slack/WhatsApp/Signal/Email a partir de um único processo de gateway e cria suas próprias skills com base na experiência.¹ O CLI é uma UI de terminal construída sobre um loop de conversa em run_agent.py; o gateway é um processo de longa duração que encaminha mensagens de plataformas de mensagens pelo mesmo loop de conversa.³

A diferença entre o uso casual e especialista do Hermes se resume a cinco sistemas. Domine estes pontos e o Hermes vira um multiplicador de força:

Resolução de provedores: como os fluxos de autenticação mapeiam para chamadas API
Hierarquia de configuração: config.yaml + .env + auth.json + SOUL.md + AGENTS.md
Sistema de tools + toolset: o que o agente pode fazer, controlado por plataforma
Sistema de skills: memória procedural que o agente cria e evolui
Gateway + cron + profiles: rodar Hermes onde você vive, não só onde você está

Principais conclusões

A autenticação de provedores tem três caminhos, não um. Chave API em .env, OAuth via hermes model/hermes auth ou endpoint personalizado em config.yaml. Escolha o caminho que corresponde ao seu provedor, não o que parece mais familiar.
Trocar de provedor é um único comando. hermes model guia você interativamente por todos os provedores compatíveis, incluindo logins OAuth, e /model provider:model troca no meio da sessão sem perder o histórico.²
Dois arquivos são a superfície de configuração editável pelo usuário. ~/.hermes/config.yaml guarda configurações e ~/.hermes/.env guarda segredos. auth.json, SOUL.md, MEMORY.md e skills/ são gerenciados diretamente pelo Hermes — você pode editar SOUL.md manualmente, mas o restante é alterado pelo próprio agente.⁴
Hermes é o sucessor do OpenClaw. Se você está migrando, hermes claw migrate importa automaticamente mais de 30 categorias de estado.⁵
A qualidade do serviço depende do seu modelo auxiliar. Visão, resumo da web, compressão e flush de memória usam um LLM auxiliar separado. Por padrão, ele é Gemini Flash via autodetecção (OpenRouter → Nous → Codex) — se nenhum deles estiver configurado, esses recursos degradam silenciosamente até você apontar os slots auxiliares para seu provedor principal.⁴

O que muda na v0.14

A v0.14.0 tem menos a ver com um recurso principal e mais com reduzir o atrito de configuração enquanto amplia onde o Hermes pode rodar.¹⁹ As principais mudanças operacionais:

Instalação e inicialização estão mais leves. pip install hermes-agent funciona pelo PyPI, adaptadores pesados são instalados de forma preguiçosa no primeiro uso, e o caminho de inicialização adia trabalho suficiente para reduzir a partida a frio em cerca de 19 segundos.
Assinaturas podem virar endpoints API locais. hermes proxy transforma provedores apoiados por OAuth, como Claude Pro, ChatGPT Pro e SuperGrok, em um endpoint local compatível com OpenAI para ferramentas como Codex, Aider, Cline e Continue.
O alcance do gateway aumenta. LINE e SimpleX Chat elevam a contagem de plataformas para 22, Microsoft Teams está conectado de ponta a ponta, o backfill de histórico do Discord vem ativado por padrão, e prompts clarify no Telegram/Discord agora usam botões nativos.
A verificação no momento da escrita melhora. Após edições, Hermes pode mostrar resumos de mutações de arquivos por turno e diagnósticos semânticos de language-server antes do próximo turno, aproximando-o de um trabalho de agente orientado por evidências.
Ferramentas de desktop e mídia ficam mais amplas. computer_use funciona por meio do cua-driver para provedores que não são Anthropic, video_generate é unificado por trás de backends plugáveis, e vision_analyze envia pixels brutos para modelos que realmente conseguem enxergar.

Cada seção abaixo se baseia na documentação upstream em hermes-agent.nousresearch.com/docs e na árvore de código-fonte em github.com/NousResearch/hermes-agent. Cada afirmação factual tem uma nota de rodapé apontando para a página upstream específica de onde veio.

Escolha seu caminho

O que você precisa	Vá para
Instalar Hermes	Instalação — instalador de uma linha ou etapas manuais
Fazer login em um provedor	Autenticação e provedores — a seção que você veio procurar
Trocar de modelo no meio da sessão	O comando `hermes auth` e Endpoints personalizados e auto-hospedados para a sintaxe de `/model`
Rodar um LLM local	Endpoints personalizados e auto-hospedados — Ollama, vLLM, SGLang, llama.cpp, LM Studio
Conectar plataformas de mensagens	Gateway de mensagens — Telegram, Discord, Slack, WhatsApp, Signal, Google Chat, LINE, SimpleX Chat (22 no total)
Escrever ou instalar uma skill	Sistema de skills — divulgação progressiva + hub de skills
Referência detalhada para cada comando CLI	Continue lendo — e acesse diretamente Comandos CLI

Como o Hermes funciona: o modelo mental

O Hermes é estruturado em torno de um único loop de conversa que qualquer ponto de entrada pode invocar. Os pontos de entrada são a CLI (cli.py), o gateway de mensagens (gateway/run.py), o adaptador ACP para integração com editores, o executor em lote e um servidor API.³ Todos eles acabam chamando AIAgent.run_conversation() em run_agent.py, que:

Monta o prompt do sistema a partir de SOUL.md, MEMORY.md, USER.md, skills, arquivos de contexto e orientações de ferramentas via prompt_builder.py³
Resolve o provider em tempo de execução via runtime_provider.py — esta é a etapa que escolhe sua autenticação, URL base e modo API³
Chama o provider usando um dos três modos API: chat_completions, codex_responses ou anthropic_messages³
Encaminha quaisquer chamadas de ferramenta retornadas por model_tools.py e pelo registro central de ferramentas (tools/registry.py)³
Repete até que o modelo produza uma resposta final e então persiste a sessão no SQLite com FTS5³

Entender esse loop importa porque todo recurso — personalidades, memória, skills, compressão, fallback — se conecta a uma dessas etapas. Quando você estiver lendo uma chave de configuração e se perguntando o que ela faz, a resposta geralmente é “é um ajuste na etapa 1, 2, 3 ou 4 do loop acima.”

Núcleo independente de plataforma. Uma única classe AIAgent atende à CLI, ao gateway, ao ACP, ao lote e ao servidor API. As diferenças de plataforma ficam no ponto de entrada, não no próprio agente.³ É por isso que os mesmos slash commands funcionam no terminal e no Telegram — eles são despachados a partir de um COMMAND_REGISTRY compartilhado em hermes_cli/commands.py.⁶

A estrutura de diretórios é o sistema. O Hermes armazena tudo em ~/.hermes/ (ou $HERMES_HOME para profiles não padrão):⁴

~/.hermes/
├── config.yaml        # Settings (model, terminal, TTS, compression, etc.)
├── .env               # API keys and secrets
├── auth.json          # OAuth provider credentials (Nous Portal, Codex, Anthropic)
├── SOUL.md            # Primary agent identity (slot #1 in system prompt)
├── memories/          # Persistent memory (MEMORY.md, USER.md)
├── skills/            # Bundled + agent-created + hub-installed skills
├── cron/              # Scheduled jobs
├── sessions/          # Gateway session state
└── logs/              # agent.log, gateway.log, errors.log (secrets auto-redacted)

Cada arquivo acima tem uma função específica; nenhum deles se sobrepõe. Se você está procurando “onde o Hermes armazena X”, está em um desses lugares.

O que há de novo na v0.18.0 (The Judgment Release)

Hermes Agent v0.18.0 (tag v2026.7.1, 1 de julho de 2026) recebe seu nome por causa de judgment: o agente verificando o próprio trabalho em vez de afirmar sucesso, e raciocínio em ensemble que você pode realmente inspecionar. Ela também fecha todo o backlog P0/P1 — cerca de 692 itens de maior prioridade resolvidos em doze dias.²²

Mixture-of-Agents como modelo de primeira classe. MoA agora pode ser selecionado como qualquer outro modelo em todas as interfaces, e o raciocínio em ensemble é visível: a saída completa de cada modelo de referência aparece como seu próprio bloco rotulado, com streaming ao vivo da resposta — você pode ver o ensemble pensar em vez de receber uma resposta mesclada opaca.²²
Contratos de conclusão para /goal. O agente verifica o próprio trabalho executando as verificações do projeto antes de relatar que uma meta foi concluída, em vez de afirmar sucesso — judgment aplicado a si mesmo.²²
/learn — descreva qualquer coisa para virar uma skill. Transforme um fluxo de trabalho em uma skill reutilizável descrevendo-o; as skills geradas seguem automaticamente as convenções do CONTRIBUTING.md do repo.²²
Linha do tempo /journey. Um histórico visual de memória e skills ao longo do tempo, com edição, além de um grafo de memória no desktop.²²
Fan-out de subagentes em background. Delegue várias tarefas que rodam simultaneamente sem bloquear a conversa — o único subagente em background da v0.17.0 vira uma frota.²²
Projetos no desktop. Projects de coding de primeira classe com um modelo de organização por projeto/repo/lane.²²
Gateway scale-to-zero. Gateways podem ficar dormentes quando ociosos e coordenar drains para deploys sem interrupção — algo relevante para qualquer pessoa que execute o Hermes como serviço sempre ativo.²²
Suporte ao Google Vertex AI. Acesso ao Gemini por meio de contas de serviço do GCP com atualização automática de token OAuth2, entrando no catálogo de providers.²²
Comando de editor /prompt. Abre $EDITOR para compor prompts de várias linhas em vez de brigar com a linha de entrada.²²

Se você está fazendo upgrade a partir da v0.17.x, nada aqui quebra a CLI. Os principais motivos para atualizar são contratos de conclusão (metas que se verificam), MoA de primeira classe com ensembles inspecionáveis e /learn para capturar skills.

O que há de novo na v0.17.0 (The Reach Release)

Hermes Agent v0.17.0 (tag v2026.6.19, 19 de junho de 2026) recebe seu nome por causa do alcance que o agente agora tem — novos canais de mensagens, novos providers de modelos e controle mais profundo no desktop e no dashboard. Ela é aditiva em relação à v0.16.x; a superfície da CLI permanece inalterada.²¹

Novos canais de mensagens. iMessage agora funciona sem um relay no Mac via Photon Spectrum (OAuth por código de dispositivo, hermes photon login); a API do WhatsApp Business Cloud é um adaptador oficial da Meta que substitui a exigência de um processo de bridge; SimpleX ganha grupos, anexos nativos, agrupamento de texto e aceite automático; e Raft entra como um plugin de plataforma incluído, com um design de wake-channel baseado em privacy-by-contract.²¹
Novos modelos e providers. O catálogo adiciona z-ai/glm-5.2 (contexto de 1M), anthropic/claude-fable-5, laguna-m.1, nemotron-3-ultra e grok-composer-2.5-fast (modelo do Cursor via OAuth da xAI, contexto de 200k). O padrão da xAI mudou para grok-build-0.1, e os modelos adaptativos Anthropic agora seguem o contrato moderno de thinking (eles nunca enviam um campo reasoning).²¹
Desktop e dashboard. O desktop adiciona subagentes em background com streaming ao vivo de “watch-windows” mostrando atividade delegada (delegate_task(background=true)), um seletor de modelo Composer, atalhos de teclado reconfiguráveis, notificações nativas do sistema operacional, rascunhos de composer por thread, temas do VS Code Marketplace e UI em japonês + chinês tradicional. O dashboard adiciona um construtor completo de profiles (modelos/skills/MCPs sem editar config.yaml), um seletor global de profile, um Skills Hub refeito com verificação de segurança, Automation Blueprints (templates parametrizados para formulário, slash command, conversa e docs) e um login seguro que retorna 401 atrás do gate OAuth.²¹
Skills e ferramentas. image_generate agora pode editar e transformar uma imagem de origem, não apenas criar uma do zero, em todos os providers de imagem compatíveis; a ferramenta memory ganhou um array operations para adicionar/substituir/remover em lote de forma atômica em uma única chamada; uma nova skill simplify-code executa uma revisão paralela com três agentes e uma passada de limpeza controlada por um nível de risco Chesterton’s-Fence; e um booleano write_approval substitui o write_mode de três estados.²¹
Arquitetura. Subagentes em background retornam um handle imediatamente e reinserem seu resultado como um novo turno; um handler de elicitação MCP permite confirmação no meio de uma chamada de ferramenta, e ferramentas MCP que se conectam tarde são expostas entre turnos (cache-safe); cron vira um CronScheduler plugável com um provider de managed-cron Chronos; e um novo Managed scope (/etc/hermes) permite que um administrador fixe configurações imutáveis para o usuário, junto com um relay Gateway-Gateway para topologias com múltiplos gateways.²¹
Novos comandos. /version, /billing (billing interativo no terminal), hermes photon login (autenticação do iMessage) e hermes curator run --consolidate — a consolidação agora é opt-in, então a curadoria rotineira em background custa zero tokens.²¹
Segurança. A v0.17.0 fecha um bypass da lista de bloqueio de shell-escape, falha fechada quando módulos de aprovação e adaptadores de gateway own-policy estão ausentes, sanitiza o ambiente para subprocessos de job-scripts do cron, redige secrets em dumps de debug de requests, verifica configs stdio MCP contra padrões de exfiltração e atualiza urllib3 e PyJWT para eliminar CVEs.²¹

Se você está fazendo upgrade a partir da v0.16.x, nada aqui quebra a CLI; são novos canais, modelos e superfícies ao redor do mesmo agente. O iMessage sem relay, os adaptadores oficiais do WhatsApp e o Managed scope para administradores são os principais motivos para atualizar.

Novidades na v0.16.0 (The Surface Release)

Hermes Agent v0.16.0 (tag v2026.6.5, 5 de junho de 2026) recebe esse nome por causa das novas superfícies que coloca diante do agente priorizado para CLI. O destaque é que Hermes não é mais limitado ao terminal.²⁰

Aplicativo desktop nativo. Hermes Desktop é um novo app Electron para macOS, Linux e Windows, com instalação em um clique e autoatualização dentro do app. Ele oferece uma janela de chat com streaming, arquivos por arrastar e soltar, colagem de imagens da área de transferência, uma paleta Cmd+K, uma lista de sessões com arquivamento e busca, e um seletor de modelo na barra de status. Ele pode se conectar a um gateway Hermes remoto por uma WebSocket segura, autenticando via OAuth ou nome de usuário/senha, com hosts remotos por profile e sessões simultâneas em múltiplos profiles vinculadas por referências @session entre profiles. A UI desktop também traz uma tradução completa para chinês simplificado (简体中文) por uma camada i18n tipada (display.language; inglês continua sendo o padrão).²⁰
Painel de administração no navegador. O dashboard web local evoluiu de uma visualização de status para um painel completo de administração: um catálogo MCP com toggles para ativar/desativar, gerenciamento de credenciais, criação de webhooks e hooks, configuração de memória, controles de gateway e uma página System com verificação antes de atualizar e Debug Share em um clique. Uma nova página Channels configura todas as plataformas de mensagens do gateway (Telegram, Discord, Slack e as demais) pelo navegador. A autenticação agora é plugável: login com nome de usuário/senha, um provedor OIDC genérico auto-hospedado, hermes dashboard register para um cliente OAuth auto-hospedado e rotação de sessão por refresh-token.²⁰
Novos CLI e slash commands. /undo [N] faz backup dos últimos N turnos do usuário com prefill e exclusão reversível, e funciona no CLI, na TUI e em plataformas de mensagens. Uma interface padrão configurável (cli vs tui) chega com override --cli; a TUI ganha um comando /model unificado e uma sobreposição Sessions. hermes portal é um alias legível para humanos para o fluxo de onboarding do Nous Portal, com novos caminhos de primeira execução Quick Setup vs Full Setup, e chegam dois diagnósticos: hermes prompt-size e hermes sessions optimize.²⁰
Novos modelos e providers. O seletor adiciona deepseek-v4-flash, MiniMax-M3 (contexto de 1M, providers nativos MiniMax), qwen3.7-plus (Nous + OpenRouter) e gemini-3.5-flash (Gemini OAuth + chave API). Um provider xAI Grok OAuth de primeira classe entra no launcher desktop, o seletor de modelos passou a ter busca fuzzy em todas as superfícies, providers com múltiplos endpoints são agrupados em uma única linha, e a atualização do catálogo passou de diária para horária.²⁰
Skills mais enxutas e divulgação progressiva. O conjunto padrão de skills removeu skills redundantes e mortas (Spotify passou para um plugin nativo, Linear para hermes mcp install linear, e várias entradas desatualizadas foram removidas), moveu mais itens para opcionais e adicionou um gate de relevância no frontmatter environments: (kanban/docker/s6) que mantém skills específicas de contexto fora do índice até serem solicitadas. NVIDIA/skills agora é um tap padrão confiável do Skills Hub ao lado de OpenAI, Anthropic e HuggingFace. Ferramentas MCP e de plugins ganharam divulgação progressiva (com escopo), e um bug de MCP que informava sucesso falso de OAuth quando nenhum token era obtido foi corrigido.²⁰
Segurança. v0.16.0 fixa uma versão corrigida do Starlette (≥1.0.1) para CVE-2026-48710 (BadHost), move verificações de URL contra SSRF para fora do event loop em caminhos async, remove o token bearer de inferência do Bedrock do env de subprocessos, adiciona bws_cache.json à proteção de leitura de segurança de arquivos, adiciona docker restart/stop/kill à lista de padrões perigosos e sanitiza unicode invisível em conteúdo de skills verificadas. A release fechou 2 problemas P0 e 62 P1, 16 deles marcados como segurança.²⁰

Se você está atualizando a partir da v0.15.x, nada disso é uma breaking change para o próprio CLI; são superfícies e providers adicionais ao redor do mesmo agente. O app desktop e o painel de administração são o motivo para atualizar se você quer executar Hermes para usuários que não usam terminal ou administrar um gateway remoto pelo navegador.

Instalação

O instalador de uma linha continua sendo o caminho guiado para a maioria dos usuários. Ele cuida de Python, uv, Node.js, ripgrep, ffmpeg, clone do repo, ambiente virtual e comando global hermes.⁷ A v0.14.0 também traz um pacote PyPI real, então pip install hermes-agent agora é uma instalação direta viável quando você já controla o ambiente Python.¹⁹

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

pip install hermes-agent
hermes

Funciona em Linux, macOS, WSL2 e Android/Termux (o instalador detecta Termux automaticamente e troca para um bundle Android testado).⁷ A v0.14.0 adiciona suporte nativo ao Windows em beta inicial via instalador PowerShell, mas WSL2 continua sendo a recomendação mais segura para uso em produção até o caminho do Windows amadurecer.¹⁹

Depois que terminar:

source ~/.bashrc    # or ~/.zshrc
hermes              # Start chatting

O único pré-requisito é git. O instalador provisiona automaticamente Python 3.11 via uv (sem exigir sudo), Node.js v22 (para automação de navegador e a ponte do WhatsApp), ripgrep e ffmpeg.⁷

Verifique a instalação

hermes version      # Check version
hermes doctor       # Diagnose config/dependency issues
hermes status       # Show current configuration + auth state
hermes dump         # Copy-pasteable setup summary for debugging

hermes doctor mostra exatamente o que está faltando e como corrigir.⁷ hermes dump é o comando de diagnóstico para colar em uma issue GitHub ou thread no Discord ao pedir ajuda — é um resumo em texto simples de toda a sua configuração, com segredos ocultados.⁸

Instalação manual

Se você precisa de controle total — versão customizada de Python, extras específicos, integração com Nix/NixOS — o fluxo manual está documentado passo a passo no guia de instalação upstream.⁷ Principais extras opcionais que você pode combinar com uv pip install -e ".[<extras>]":

Extra	O que adiciona
`all`	Tudo abaixo
`messaging`	Gateway Telegram e Discord
`cron`	Parsing de expressões cron
`cli`	UI de menu no terminal para o assistente de configuração
`modal`	Backend de execução na cloud Modal
`voice`	Entrada de microfone no CLI + reprodução de áudio
`tts-premium`	Vozes premium ElevenLabs
`honcho`	Memória AI-native (integração Honcho)
`mcp`	Suporte a Model Context Protocol
`homeassistant`	Integração com Home Assistant
`acp`	Suporte à integração com editor ACP
`slack`	Mensagens Slack
`pty`	Suporte a terminal PTY (ferramentas CLI interativas)
`dev`	pytest e utilitários de teste
`termux`	Bundle Android testado (inclui `cron`, `cli`, `pty`, `mcp`, `honcho`, `acp`)

O comando de instalação do Termux é diferente — ele usa pip com um arquivo de constraints, não uv pip:

python -m pip install -e ".[termux]" -c constraints-termux.txt

Isso acontece porque .[all] no Android puxa faster-whisper pelo extra voice, que depende de wheels ctranslate2 que não são publicados para Android.⁷

Autenticação e provedores

Hermes oferece suporte a ~19 provedores de primeira classe, além de endpoints personalizados, e 3 caminhos distintos de autenticação. Aqui está toda a superfície de autenticação, organizada por caminho para você encontrar o que corresponde ao que você tem.

Os 3 caminhos de autenticação

Todo provedor no Hermes se encaixa em um destes 3 padrões de autenticação:

Caminho 1 — chave API em .env. Coloque sua chave em ~/.hermes/.env e o Hermes a lê na inicialização. Usado por OpenRouter, AI Gateway, z.ai/GLM, Kimi/Moonshot, MiniMax (e MiniMax China), Alibaba Cloud/DashScope, Kilo Code, OpenCode Zen, OpenCode Go, DeepSeek, Hugging Face, Google/Gemini e a maioria dos provedores de terceiros.²

Caminho 2 — OAuth via hermes model ou hermes auth. Inicia um fluxo de código de dispositivo, abre um navegador, armazena credenciais em ~/.hermes/auth.json (e pode importar credenciais existentes de ferramentas como Claude Code ou Codex CLI). Usado por Nous Portal, OpenAI Codex (conta ChatGPT), GitHub Copilot e Anthropic (Claude Pro/Max).²

Caminho 3 — endpoint personalizado em config.yaml. Para qualquer API compatível com OpenAI — Ollama, vLLM, SGLang, llama.cpp, LM Studio, proxy LiteLLM, Together AI, Groq, Azure OpenAI ou seu próprio servidor self-hosted. Configurado uma vez via hermes model → Custom endpoint e depois persistido em config.yaml.²

A matriz completa de provedores

Esta é a lista completa de provedores de primeira classe, com o fluxo exato de configuração para cada um.²

Provedor	Caminho de autenticação	Configuração
Nous Portal	OAuth	`hermes model` (login OAuth, baseado em assinatura)
OpenAI Codex	OAuth	`hermes model` (código de dispositivo do ChatGPT, usa modelos Codex)
GitHub Copilot	OAuth ou token	`hermes model` (código de dispositivo OAuth), ou `COPILOT_GITHUB_TOKEN` / `GH_TOKEN` / `gh auth token`
GitHub Copilot ACP	Subprocesso local	`hermes model` (requer CLI `copilot` no PATH + `copilot login`)
Anthropic	OAuth ou chave API	`hermes model` (prefere credenciais do Claude Code), ou `ANTHROPIC_API_KEY`, ou setup-token `ANTHROPIC_TOKEN`
OpenRouter	chave API	`OPENROUTER_API_KEY` em `~/.hermes/.env`
AI Gateway (Vercel)	chave API	`AI_GATEWAY_API_KEY` em `~/.hermes/.env` (provedor: `ai-gateway`)
z.ai / GLM (ZhipuAI)	chave API	`GLM_API_KEY` em `~/.hermes/.env` (provedor: `zai`)
Kimi / Moonshot	chave API	`KIMI_API_KEY` em `~/.hermes/.env` (provedor: `kimi-coding`)
MiniMax (global)	chave API	`MINIMAX_API_KEY` em `~/.hermes/.env` (provedor: `minimax`)
MiniMax China	chave API	`MINIMAX_CN_API_KEY` em `~/.hermes/.env` (provedor: `minimax-cn`)
Alibaba Cloud (Qwen)	chave API	`DASHSCOPE_API_KEY` em `~/.hermes/.env` (provedor: `alibaba`, aliases: `dashscope`, `qwen`)
Kilo Code	chave API	`KILOCODE_API_KEY` em `~/.hermes/.env` (provedor: `kilocode`)
OpenCode Zen	chave API	`OPENCODE_ZEN_API_KEY` em `~/.hermes/.env` (provedor: `opencode-zen`)
OpenCode Go	chave API	`OPENCODE_GO_API_KEY` em `~/.hermes/.env` (provedor: `opencode-go`)
DeepSeek	chave API	`DEEPSEEK_API_KEY` em `~/.hermes/.env` (provedor: `deepseek`)
Hugging Face	chave API	`HF_TOKEN` em `~/.hermes/.env` (provedor: `huggingface`, alias: `hf`)
Google / Gemini	chave API	`GOOGLE_API_KEY` ou `GEMINI_API_KEY` em `~/.hermes/.env` (provedor: `gemini`)
xAI (Grok)	Provedor nativo / SuperGrok OAuth	Provedor de primeira classe com acesso API direto e catálogo de modelos (v0.9.0+). A v0.14.0 adiciona SuperGrok OAuth e aumenta o grok-4.3 para uma janela de contexto de 1M em contas qualificadas.²¹⁶¹⁹ A v0.17.0 adiciona `grok-composer-2.5-fast` (modelo do Cursor via xAI OAuth, contexto de 200k) e muda o padrão da xAI para `grok-build-0.1`.²¹
xAI Custom Voices	chave API	Provedor TTS com clonagem de voz. Novo na v0.13.0; configure em `tts:` no `config.yaml` e forneça a chave da xAI em `.env`.¹⁸
Xiaomi MiMo	Provedor nativo	Provedor de primeira classe com assistente de configuração e catálogo de modelos. MiMo v2 Pro gratuito no Nous Portal para tarefas auxiliares (v0.9.0+).¹⁶¹⁵
Google AI Studio	chave API	`GOOGLE_API_KEY` ou `GEMINI_API_KEY` em `~/.hermes/.env`. Acesso direto ao Gemini com comprimentos de contexto detectados automaticamente via registro models.dev (v0.8.0+).¹⁵
Qwen Cloud	OAuth	Provedor OAuth com suporte a solicitação no portal (v0.8.0+). O provedor foi renomeado de Alibaba Cloud para Qwen Cloud na v0.14.0; chaves de configuração existentes continuam funcionando.¹⁵¹⁹
Endpoint personalizado	config.yaml	`hermes model` → “Custom endpoint” (salvo em `config.yaml`)

Anthropic: 3 métodos de autenticação

Anthropic tem sua própria seção porque o Hermes oferece suporte a 3 caminhos distintos para entrar no Claude, e escolher o caminho certo faz diferença. Da documentação upstream:²

# Method 1: API key (pay-per-token)
export ANTHROPIC_API_KEY=***
hermes chat --provider anthropic --model claude-sonnet-4-6

# Method 2: OAuth through hermes model (preferred)
# Uses Claude Code's credential store when available
hermes model

# Method 3: Manual setup-token (fallback/legacy)
export ANTHROPIC_TOKEN=***
hermes chat --provider anthropic

# Auto-detect Claude Code credentials
hermes chat --provider anthropic   # reads Claude Code files automatically

Quando você escolhe Anthropic OAuth por meio de hermes model, o Hermes prefere o armazenamento de credenciais do próprio Claude Code em vez de copiar o token para ~/.hermes/.env. Isso mantém as credenciais Claude renováveis como renováveis.² Se você já usa Claude Code na mesma máquina, este é o caminho mais limpo.

Para fixar Anthropic permanentemente em config.yaml:

model:
  provider: "anthropic"
  default: "claude-sonnet-4-6"

--provider claude e --provider claude-code também funcionam como atalhos para --provider anthropic.²

GitHub Copilot: 2 modos

Copilot é compatível em 2 modos: API direto do Copilot (recomendado) e Copilot ACP (que inicia o CLI local do Copilot como subprocesso).²

# Direct Copilot API
hermes chat --provider copilot --model gpt-5.4

# Copilot ACP (requires the Copilot CLI in PATH + an existing copilot login)
hermes chat --provider copilot-acp --model copilot-acp

A autenticação é verificada nesta ordem, segundo a documentação upstream:² 1. variável de ambiente COPILOT_GITHUB_TOKEN 2. variável de ambiente GH_TOKEN 3. variável de ambiente GITHUB_TOKEN 4. fallback do CLI gh auth token 5. login por código de dispositivo OAuth via hermes model

O tipo de token importa. O API do Copilot não oferece suporte a Personal Access Tokens clássicos (ghp_*). Os tipos compatíveis são tokens OAuth (gho_*), PATs refinados (github_pat_* com permissão Copilot Requests) e tokens de GitHub App (ghu_*). Se o seu gh auth token retornar um token ghp_*, use hermes model para autenticar via OAuth.²

Provedores chineses de AI (suporte de primeira classe)

Hermes tem suporte integrado para z.ai/GLM, Kimi/Moonshot, MiniMax (endpoints globais + China) e Alibaba Cloud com IDs de provedor dedicados.²

# z.ai / ZhipuAI GLM
hermes chat --provider zai --model glm-5                 # Requires: GLM_API_KEY

# Kimi / Moonshot AI
hermes chat --provider kimi-coding --model kimi-for-coding   # Requires: KIMI_API_KEY

# MiniMax (global)
hermes chat --provider minimax --model MiniMax-M2.7          # Requires: MINIMAX_API_KEY

# MiniMax (China)
hermes chat --provider minimax-cn --model MiniMax-M2.7       # Requires: MINIMAX_CN_API_KEY

# Alibaba Cloud / DashScope (Qwen)
hermes chat --provider alibaba --model qwen3.5-plus          # Requires: DASHSCOPE_API_KEY

As URLs base podem ser substituídas pelas variáveis de ambiente GLM_BASE_URL, KIMI_BASE_URL, MINIMAX_BASE_URL, MINIMAX_CN_BASE_URL ou DASHSCOPE_BASE_URL.²

Z.AI detecta o endpoint automaticamente. Ao usar o provedor z.ai/GLM, o Hermes testa vários endpoints (global, China, variantes de coding) para encontrar um que aceite sua chave API. O endpoint funcional é armazenado em cache automaticamente — GLM_BASE_URL não é necessário para a maioria dos usuários.²

xAI (Grok) habilita cache de prompt automaticamente. Quando a URL base contém x.ai, o Hermes envia o header x-grok-conv-id em toda solicitação para rotear ao mesmo servidor dentro de uma sessão de conversa, reutilizando prompts de sistema e histórico em cache.² Automático; nenhuma configuração necessária.

O comando `hermes auth`

hermes auth é o comando de gerenciamento de credenciais para pools e credenciais OAuth.⁶

hermes auth                              # Interactive wizard
hermes auth list                         # Show all credential pools
hermes auth list openrouter              # Show one provider's pool
hermes auth add openrouter --api-key sk-or-v1-xxx
hermes auth add anthropic --type oauth
hermes auth remove openrouter 2          # Remove by index
hermes auth reset openrouter             # Clear cooldowns

Pools de credenciais são como você rotaciona várias chaves API ou tokens OAuth para o mesmo provedor — útil para distribuir limites de taxa entre várias chaves sem alterar código.⁶ Os comandos legados hermes login / hermes logout foram removidos; use hermes auth em vez disso.⁶

Endpoints personalizados e self-hosted

Hermes funciona com qualquer endpoint API compatível com OpenAI. Se um servidor implementa /v1/chat/completions, você pode apontar o Hermes para ele.²

Configuração interativa (recomendada):

hermes model
# Select "Custom endpoint (self-hosted / VLLM / etc.)"
# Enter: API base URL, API key, Model name

config.yaml manual:

model:
  default: your-model-name
  provider: custom
  base_url: http://localhost:8000/v1
  api_key: your-key-or-leave-empty-for-local

Ambas as abordagens persistem em config.yaml, que é a única fonte de verdade para modelo principal, provedor e URL base.² As env vars legadas OPENAI_BASE_URL e LLM_MODEL não são mais lidas para configuração do modelo principal — use hermes model ou edite config.yaml diretamente.² (OPENAI_BASE_URL + OPENAI_API_KEY ainda são respeitadas como fallback para o caminho auxiliar de roteamento provider: "main", então não as exclua às cegas se você as usa ali.)⁴

Alternar endpoints personalizados no meio da sessão:

/model custom:qwen-2.5             # Custom endpoint with explicit model
/model custom                      # Auto-detect the model from the endpoint
/model custom:local:qwen-2.5       # Named custom provider "local"
/model custom:work:llama3          # Named custom provider "work"
/model openrouter:claude-sonnet-4  # Back to a cloud provider

/model custom (puro, sem nome de modelo) consulta o API /v1/models do seu endpoint e seleciona automaticamente o modelo se exatamente 1 estiver carregado — útil para servidores locais que executam um único modelo.²

Servidores LLM locais (templates de configuração)

A documentação upstream tem guias completos de configuração para Ollama, vLLM, SGLang, llama.cpp e LM Studio. Aqui estão os comandos principais que você realmente vai executar. Cada um foi projetado para produzir um endpoint funcional ao qual o Hermes pode se conectar.²

Ollama — caminho local mais fácil, zero configuração:

ollama pull qwen2.5-coder:32b
OLLAMA_CONTEXT_LENGTH=32768 ollama serve   # Raise from 4k default
hermes model   # Custom endpoint → http://localhost:11434/v1 → qwen2.5-coder:32b

Pegadinha crítica do Ollama: o Ollama usa por padrão comprimentos de contexto muito baixos (4.096 tokens com menos de 24 GB de VRAM). Você precisa aumentá-lo via OLLAMA_CONTEXT_LENGTH ou um Modelfile — o API compatível com OpenAI não aceita comprimento de contexto do cliente, então o Hermes não pode defini-lo para você.² Para uso com agentes, defina pelo menos 16k–32k.

vLLM — serving GPU de alta performance:

pip install vllm
vllm serve meta-llama/Llama-3.1-70B-Instruct \
  --port 8000 \
  --max-model-len 65536 \
  --tensor-parallel-size 2 \
  --enable-auto-tool-choice \
  --tool-call-parser hermes

Chamadas de ferramenta exigem --enable-auto-tool-choice e --tool-call-parser <name>. Parsers compatíveis: hermes (Qwen 2.5, Hermes 2/3), llama3_json, mistral, deepseek_v3, deepseek_v31, xlam, pythonic. Sem essas flags, chamadas de ferramenta voltarão como texto simples.²

SGLang — serving rápido com RadixAttention para reutilização de cache KV:

pip install "sglang[all]"
python -m sglang.launch_server \
  --model meta-llama/Llama-3.1-70B-Instruct \
  --port 30000 \
  --context-length 65536 \
  --tp 2 \
  --tool-call-parser qwen

Pegadinha do SGLang: o max_tokens padrão é 128. Defina --default-max-tokens no servidor ou configure model.max_tokens em config.yaml se as respostas forem cortadas.²

llama.cpp / llama-server — CPU e Apple Silicon Metal:

./build/bin/llama-server \
  --jinja -fa \
  -c 32768 \
  -ngl 99 \
  -m models/qwen2.5-coder-32b-instruct-Q4_K_M.gguf \
  --port 8080 --host 0.0.0.0

--jinja é obrigatório para chamadas de ferramenta. Sem ele, o llama-server ignora totalmente o parâmetro tools e o modelo tenta chamar ferramentas escrevendo JSON no texto da resposta — o que o Hermes não consegue interpretar como chamadas reais de ferramenta.²

LM Studio — app desktop com GUI:

Inicie o servidor pelo app LM Studio (aba Developer → Start Server), ou via CLI: lms server start (inicia na porta 1234) e lms load qwen2.5-coder --context-length 32768.² Depois aponte hermes model para http://localhost:1234/v1.

Pegadinha crítica do LM Studio: o LM Studio lê o comprimento de contexto dos metadados do modelo, mas muitos modelos GGUF informam padrões de 2048 ou 4096. Sempre defina explicitamente o comprimento de contexto nas configurações de modelo do LM Studio — clique no ícone de engrenagem ao lado do seletor de modelo, defina “Context Length” para pelo menos 16384 (de preferência 32768) e recarregue o modelo.²

Provedores personalizados nomeados

Se você trabalha com vários endpoints personalizados (um servidor de desenvolvimento local e um servidor GPU remoto, por exemplo), defina-os como provedores personalizados nomeados em config.yaml:²

custom_providers:
  - name: local
    base_url: http://localhost:8080/v1
    # api_key omitted — Hermes uses "no-key-required" for keyless local servers
  - name: work
    base_url: https://gpu-server.internal.corp/v1
    api_key: corp-api-key
    api_mode: chat_completions      # optional, auto-detected from URL
  - name: anthropic-proxy
    base_url: https://proxy.example.com/anthropic
    api_key: proxy-key
    api_mode: anthropic_messages    # for Anthropic-compatible proxies

Depois alterne entre eles no meio da sessão com a sintaxe tripla:

/model custom:local:qwen-2.5
/model custom:work:llama3-70b
/model custom:anthropic-proxy:claude-sonnet-4

Você também pode selecionar provedores personalizados nomeados no menu interativo hermes model.²

Arquitetura de provedores plugável (v0.13.0+)

A v0.13.0 traz uma ABC ProviderProfile mais um diretório plugins/model-providers/ para que provedores de inferência de terceiros possam ser adicionados sem modificações no core.¹⁸ Se um provedor fala em modo API compatível com OpenAI, Anthropic ou Codex, você pode implementar uma subclasse de ProviderProfile que declare o caminho de autenticação, a URL base, o catálogo de modelos e os headers de cache; o Hermes a resolve pelo mesmo caminho runtime_provider.py usado pelos provedores integrados. Esta é a mudança arquitetural por trás da expansão de provedores da v0.13.0: em vez de editar o código core para adicionar um provedor, você distribui um plugin.

Proxy local compatível com OpenAI (v0.14.0+)

hermes proxy expõe um endpoint local compatível com OpenAI apoiado pelo provedor OAuth no qual o Hermes já está autenticado — Claude Pro, ChatGPT Pro, SuperGrok ou outro provedor compatível configurado.¹⁹ Isso significa que ferramentas que esperam um API no estilo OpenAI, incluindo Codex CLI, Aider, Cline, Continue ou scripts personalizados, podem reutilizar sua autenticação do Hermes baseada em assinatura sem uma chave API separada. Trate o proxy como infraestrutura local de desenvolvimento: vincule-o intencionalmente, não o exponha de forma ampla e mantenha os termos específicos de cada provedor em mente.

Detecção de comprimento de contexto

Duas configurações são confundidas o tempo todo, segundo a documentação upstream:²

context_length — a janela total de contexto (orçamento combinado de tokens de entrada + saída, por exemplo, 1.000.000 para Claude Opus 4.7 ou 200.000 para Sonnet 4.6). O Hermes usa isso para decidir quando comprimir o histórico.
model.max_tokens — o limite de saída (máximo de tokens que o modelo pode gerar em uma única resposta). Não tem relação com o comprimento do histórico.

Defina context_length quando a detecção automática errar o tamanho da janela:

model:
  default: "qwen3.5:9b"
  base_url: "http://localhost:8080/v1"
  context_length: 131072      # tokens

Hermes usa uma cadeia de resolução com várias fontes para detectar janelas de contexto: substituição por config → modelo específico de provedor personalizado → cache persistente → /models do endpoint → /v1/models do Anthropic → API do OpenRouter → Nous Portal → models.dev (registro mantido pela comunidade para mais de 3800 modelos) → padrões de fallback (128K).² O sistema é ciente do provedor, então o mesmo modelo pode ter limites de contexto diferentes dependendo de quem o serve (por exemplo, claude-opus-4.6 tem 1M no Anthropic direto, mas 128K no GitHub Copilot).²

Rotação e fallback de provedores

Pools de credenciais. Quando você tem várias chaves API para o mesmo provedor, configure uma estratégia de rotação via hermes auth. É assim que você distribui limites de taxa entre várias chaves.⁶

Modelo de fallback. Configure um provider:model reserva para o qual o Hermes alterna automaticamente quando seu modelo primário falha (limites de taxa, erros de servidor, falhas de autenticação):²

fallback_model:
  provider: openrouter            # required
  model: anthropic/claude-sonnet-4  # required
  # base_url: http://localhost:8000/v1    # optional, for custom endpoints
  # api_key_env: MY_CUSTOM_KEY           # optional, env var name

O fallback troca modelo e provedor no meio da sessão sem perder sua conversa. Ele dispara no máximo uma vez por sessão.² Provedores compatíveis para fallback: openrouter, nous, openai-codex, copilot, copilot-acp, anthropic, huggingface, zai, kimi-coding, minimax, minimax-cn, deepseek, ai-gateway, opencode-zen, opencode-go, kilocode, alibaba, custom.²

Modelos auxiliares

Hermes usa modelos “auxiliares” leves para tarefas secundárias: análise de imagem, resumo de páginas web, análise de screenshots do navegador, classificação de aprovação de comandos perigosos, compressão de contexto, resumo de busca de sessão, correspondência de skill, despacho de ferramenta MCP e flush de memória.⁴ Por padrão, eles usam Gemini Flash via detecção automática (OpenRouter → Nous → Codex).

Você pode configurar qual modelo e provedor cada tarefa auxiliar usa. Todo slot auxiliar usa os mesmos 3 controles: provider, model, base_url.⁴

auxiliary:
  vision:
    provider: "auto"                # "auto", "openrouter", "nous", "codex", "main", etc.
    model: ""                       # e.g. "openai/gpt-4o", "google/gemini-2.5-flash"
    base_url: ""                    # Custom OpenAI-compatible endpoint
    api_key: ""                     # Falls back to OPENAI_API_KEY
    timeout: 30
    download_timeout: 30
  web_extract:
    provider: "auto"
    model: ""
    timeout: 360
  approval:
    provider: "auto"
    model: ""
    timeout: 30
  compression:
    timeout: 120
  session_search: { provider: "auto", model: "", timeout: 30 }
  skills_hub:    { provider: "auto", model: "", timeout: 30 }
  mcp:           { provider: "auto", model: "", timeout: 30 }
  flush_memories:{ provider: "auto", model: "", timeout: 30 }

A opção de provedor "main" significa “use qualquer provedor que meu agente principal usa” — válida somente dentro das configurações auxiliary:, compression: e fallback_model:. Ela não é válida para sua configuração de nível superior model.provider. Se você usa um endpoint personalizado compatível com OpenAI como modelo principal, defina provider: custom na seção model:.⁴

Por que isso importa: se você configurou apenas Anthropic OAuth (sem chave OpenRouter), sua visão, resumo web e compressão vão degradar ou falhar porque a cadeia padrão de fallback auxiliar tenta OpenRouter primeiro. Adicione uma OPENROUTER_API_KEY para tarefas auxiliares, ou reconfigure cada slot auxiliar para usar seu provedor principal:

auxiliary:
  vision:
    provider: "main"
  web_extract:
    provider: "main"

Esta é a pegadinha mais comum de “meus recursos silenciosamente não funcionam” para novos usuários do Hermes.

Sistema de configuração

Hermes tem um sistema de configuração em camadas. Entender a precedência é essencial porque as camadas superiores substituem as inferiores, e uma das camadas é um registro global de providers que você não consegue ver em config.yaml.

Estrutura dos arquivos de configuração

Segundo a documentação upstream, estes são os arquivos que compõem uma configuração do Hermes:⁴

~/.hermes/
├── config.yaml       # All settings (model, terminal, TTS, compression, memory, toolsets, ...)
├── .env              # Secrets (API keys, bot tokens, passwords)
├── auth.json         # OAuth provider credentials (Nous Portal, Codex, Anthropic)
├── SOUL.md           # Primary agent identity (slot #1 in system prompt)
├── memories/         # Persistent memory (MEMORY.md, USER.md)
├── skills/           # Bundled + agent-created + hub-installed skills
├── cron/             # Scheduled jobs
├── sessions/         # Gateway session state
└── logs/             # agent.log, gateway.log, errors.log (secrets auto-redacted)

config.yaml vs .env — quando ambos estão definidos, config.yaml vence para configurações que não são secretas.⁴ A regra é: - Secrets (chaves API, tokens de bot, senhas) → .env - Todo o resto (modelo, backend do terminal, configurações de compressão, limites de memória, toolsets) → config.yaml

Secrets podem ser referenciados a partir de config.yaml usando interpolação no estilo shell:⁴

auxiliary:
  vision:
    api_key: ${GOOGLE_API_KEY}
    base_url: ${CUSTOM_VISION_URL}
  delegation:
    api_key: ${DELEGATION_KEY}

Gerenciando a configuração

hermes config                # View current configuration
hermes config show           # Same as above
hermes config edit           # Open config.yaml in your editor
hermes config set KEY VAL    # Set a specific value
hermes config path           # Print the config file path
hermes config env-path       # Print the .env file path
hermes config check          # Check for missing options (after updates)
hermes config migrate        # Interactively add missing options

Exemplos:⁴

hermes config set model anthropic/claude-opus-4
hermes config set terminal.backend docker
hermes config set OPENROUTER_API_KEY sk-or-...   # Saves to .env

hermes config check e hermes config migrate são os comandos para executar depois de cada hermes update — eles detectam novas opções de configuração que ainda não existem no seu arquivo.⁶

Precedência da configuração

Hermes carrega a configuração de várias fontes. Quando várias fontes definem o mesmo valor, a fonte de maior prioridade vence:⁴

argumentos CLI — hermes chat --model anthropic/claude-sonnet-4 (substituição por invocação)
Variáveis de ambiente — aplicadas na inicialização do processo
config.yaml — o arquivo principal de configurações
.env — apenas secrets
Padrões integrados — aplicados quando nada mais define um valor

Flags CLI sempre vencem nessa invocação específica. config.yaml é a fonte da verdade de longo prazo.

Localização (v0.13.0+)

A v0.13.0 adicionou 7 locales para mensagens de CLI e do gateway: chinês (simplificado), japonês, alemão, espanhol, francês, ucraniano e turco.¹⁸ A v0.14.0 localiza todos os comandos do gateway e o dashboard web, adiciona mais 8 locales e leva o total para 16.¹⁹ A documentação atualmente está localizada apenas em zh-Hans. O locale é resolvido a partir das variáveis de ambiente LC_ALL / LANG ou de uma chave explícita locale: em config.yaml. O inglês continua sendo o padrão e a fonte da verdade para qualquer string que uma tradução ainda não cubra.

Profiles — várias instâncias isoladas do Hermes

Profiles permitem que você tenha várias instâncias isoladas do Hermes, cada uma com sua própria configuração, sessões, skills, memória e PID do gateway. É assim que você executa “Hermes de trabalho” e “Hermes pessoal” lado a lado sem que um veja o estado do outro.⁶

hermes profile list
hermes profile create work --clone                  # Clone from current profile
hermes profile use work                             # Set sticky default
hermes profile alias work --name h-work             # Create wrapper script
hermes profile export work -o work-backup.tar.gz
hermes profile import work-backup.tar.gz --name restored
hermes -p work chat -q "Hello from work profile"    # One-off without switching

Cada profile recebe seu próprio HERMES_HOME (~/.hermes-<name>/ por padrão), então vários profiles podem executar o gateway simultaneamente sem interferir uns nos outros.⁶³

Comandos CLI

Esta seção é a referência prática para comandos CLI de nível superior. Para a referência autoritativa derivada do código, consulte a Referência de comandos CLI.⁶

Opções globais

hermes [global-options] <command> [subcommand/options]

Opção	Descrição
`--version`, `-V`	Mostra a versão e sai
`--profile <name>`, `-p <name>`	Seleciona qual profile do Hermes usar
`--resume <session>`, `-r <session>`	Retoma uma sessão por ID ou título
`--continue [name]`, `-c [name]`	Retoma a sessão mais recente (ou corresponde a um título)
`--worktree`, `-w`	Inicia em um git worktree isolado
`--yolo`	Ignora prompts de aprovação para comandos perigosos
`--pass-session-id`	Inclui o ID da sessão no prompt de sistema do agente

Comandos de nível superior

Comando	Finalidade
`hermes chat`	Chat interativo ou de uma única execução
`hermes model`	Escolhe interativamente o provider e o modelo padrão
`hermes gateway`	Executa ou gerencia o gateway de mensagens
`hermes setup`	Assistente de configuração interativo
`hermes auth`	Gerencia credenciais — adicionar, listar, remover, redefinir, definir estratégia
`hermes status`	Mostra o status do agente, auth e plataforma
`hermes cron`	Inspeciona e aciona o cron scheduler
`hermes webhook`	Gerencia assinaturas dinâmicas de webhook
`hermes doctor`	Diagnostica problemas de configuração e dependências
`hermes dump`	Resumo de configuração copiável para suporte/debugging
`hermes logs`	Visualiza, acompanha e filtra logs do agente/gateway/erros
`hermes config`	Mostra, edita, migra e consulta a configuração
`hermes pairing`	Aprova ou revoga códigos de pairing de mensagens
`hermes skills`	Navega, instala, publica e audita skills
`hermes honcho`	Gerencia a memória entre sessões do Honcho
`hermes memory`	Configura o provider de memória externa
`hermes acp`	Executa o Hermes como um servidor ACP (integração com editor)
`hermes mcp`	Gerencia a configuração do servidor MCP; executa o Hermes como servidor MCP
`hermes plugins`	Gerencia plugins
`hermes tools`	Configura tools habilitadas por plataforma
`hermes sessions`	Navega, exporta, limpa e exclui sessões
`hermes insights`	Mostra analytics de tokens/custos/atividade
`hermes claw`	Helpers de migração do OpenClaw
`hermes profile`	Gerencia profiles (múltiplas instâncias isoladas)
`hermes completion`	Imprime scripts de autocompletar do shell (bash/zsh)
`hermes whatsapp`	Configura e pareia a bridge do WhatsApp
`hermes version`	Imprime informações de versão
`hermes update`	Puxa o código mais recente e reinstala dependências
`hermes uninstall`	Remove o Hermes do sistema (`--full` também exclui config/dados)
`hermes backup`	Backup completo de configuração, sessões, skills e memória (v0.9.0+)¹⁶
`hermes import`	Restaura a partir de um arquivo de backup — migra entre máquinas ou faz rollback (v0.9.0+)¹⁶
`hermes dashboard`	Inicia o dashboard web local para gerenciamento do agente pelo navegador (v0.9.0+)¹⁶
`hermes debug share`	Faz upload de um relatório completo de debug para um pastebin para compartilhar durante troubleshooting (v0.9.0+)¹⁶

`hermes chat` — O ponto de entrada principal

hermes sem argumentos coloca você no chat interativo. hermes chat é a forma explícita com opções:⁶

hermes chat -q "Summarize the latest PRs"           # One-shot, non-interactive
hermes chat --provider openrouter --model anthropic/claude-sonnet-4.6
hermes chat --toolsets web,terminal,skills          # Enable specific toolsets
hermes chat --quiet -q "Return only JSON"           # Programmatic mode
hermes chat --worktree -q "Review repo and open a PR"

Opções principais:

Opção	Descrição
`-q`, `--query "..."`	Prompt de uma única execução, não interativo
`-m`, `--model <model>`	Sobrescreve o modelo para esta execução
`-t`, `--toolsets <csv>`	Habilita um conjunto de toolsets separado por vírgulas
`--provider <provider>`	Força um provider (veja a lista completa)
`-s`, `--skills <name>`	Pré-carrega uma ou mais skills para esta sessão
`-v`, `--verbose`	Saída detalhada
`-Q`, `--quiet`	Modo programático (sem banner, spinner, prévias)
`--resume <session>`	Retoma uma sessão diretamente de `chat`
`--worktree`	Cria um git worktree isolado
`--checkpoints`	Habilita checkpoints do filesystem antes de mudanças destrutivas
`--yolo`	Ignora prompts de aprovação
`--source <tag>`	Tag de origem da sessão (padrão: `cli`; use `tool` para integrações)
`--max-turns <N>`	Máximo de iterações de chamada de tools por turno (padrão: 90)

`hermes setup` — Assistente completo

Executa o assistente de configuração completo ou entra direto em uma seção:⁶

hermes setup                 # Full wizard
hermes setup model           # Provider and model only
hermes setup terminal        # Terminal backend only
hermes setup gateway         # Messaging platforms only
hermes setup tools           # Tool enable/disable per platform
hermes setup agent           # Agent behavior only
hermes setup --non-interactive
hermes setup --reset         # Reset config to defaults before setup

`hermes logs` — Consulta estruturada de logs

hermes logs é mais poderoso que tail -f nos arquivos de log porque oferece suporte a filtros por nível, ID de sessão e intervalo de tempo simultaneamente.⁶

hermes logs                          # Last 50 lines of agent.log
hermes logs -f                       # Follow in real time
hermes logs gateway -n 100           # Last 100 lines of gateway.log
hermes logs --level WARNING --since 1h   # Warnings from the last hour
hermes logs --session abc123         # Filter by session ID substring
hermes logs errors --since 30m -f    # Follow errors.log from 30m ago
hermes logs list                     # List all log files with sizes

Os arquivos de log ficam em ~/.hermes/logs/:⁶ - agent.log — toda a atividade do agente (chamadas API, despacho de tools, ciclo de vida da sessão, INFO+) - errors.log — apenas avisos e erros (um subconjunto filtrado de agent.log) - gateway.log — atividade do gateway de mensagens (conexões de plataforma, despacho, webhooks)

A rotação é automática via RotatingFileHandler do Python — procure por agent.log.1, agent.log.2 etc.⁶

`hermes doctor` — Diagnósticos

hermes doctor [--fix] é o primeiro comando a executar quando algo dá errado. Ele verifica a validade da configuração, a presença de dependências, a disponibilidade de chave API, o status do serviço e pode tentar reparos automáticos com --fix.⁶

Para compartilhar diagnósticos com outra pessoa, use hermes dump — ele produz um resumo compacto em texto simples com chaves API ocultadas, pronto para colar em uma issue do GitHub ou thread no Discord.⁶

Comandos slash

Os comandos slash rodam dentro de uma sessão de chat ativa (CLI ou plataforma de mensagens). Eles são despachados a partir de um COMMAND_REGISTRY compartilhado em hermes_cli/commands.py, por isso a maioria dos comandos funciona de forma idêntica em todas as superfícies.⁹

Controle de sessão

Comando	Descrição
`/new` (alias `/reset`)	Iniciar uma nova sessão
`/clear`	Limpar a tela + iniciar uma nova sessão
`/history`	Mostrar o histórico da conversa
`/save`	Salvar a conversa atual
`/retry`	Tentar novamente a última mensagem
`/undo`	Remover a última troca entre usuário/assistente
`/title <name>`	Definir um título para a sessão atual
`/compress`	Comprimir manualmente o contexto da conversa
`/rollback [number]`	Listar ou restaurar checkpoints do sistema de arquivos
`/stop`	Encerrar todos os processos em segundo plano em execução
`/queue <prompt>`	Colocar um prompt na fila para o próximo turno. Pegadinha: `/q` é reivindicado tanto por `/queue` quanto por `/quit`; o último registro vence e, na prática, `/q` resolve para `/quit` — sempre digite `/queue` explicitamente.⁹
`/resume [name]`	Retomar uma sessão nomeada anteriormente
`/statusbar` (alias `/sb`)	Alternar a barra de status de contexto/modelo
`/background <prompt>` (alias `/bg`)	Executar um prompt em uma sessão separada em segundo plano
`/btw <question>`	Pergunta paralela efêmera (sem tools, não persistida)
`/plan [request]`	Carregar a skill `plan` incluída para escrever um plano em vez de executar
`/branch [name]` (alias `/fork`)	Criar uma ramificação da sessão atual
`/goal <target>`	Fixar o agente em um alvo para que ele continue na tarefa entre turnos. Padrão Ralph-loop como primitivo de primeira classe. Orçamento de turnos configurável. Novo na v0.13.0.¹⁸
`/subgoal <criterion>`	Adicionar critérios de sucesso a um `/goal` ativo sem reiniciar o loop. Novo na v0.14.0.¹⁹
`/handoff <target>`	Transferir a sessão ativa — mensagens, chamadas de tools e contexto — para outro modelo, persona ou profile. Novo na v0.14.0.¹⁹

Configuração e modelo

Comando	Descrição
`/config`	Mostrar a configuração atual
`/model [model-name]`	Mostrar ou alterar o modelo atual
`/provider`	Mostrar os provedores disponíveis e o provedor atual
`/personality [name]`	Definir uma camada de personalidade
`/verbose`	Alternar a exibição de progresso das tools
`/reasoning`	Gerenciar o esforço e a exibição de raciocínio
`/skin`	Mostrar ou alterar a skin/tema de exibição
`/voice [on\\|off\\|tts\\|status]`	Alternar o modo de voz do CLI
`/yolo`	Alternar o modo YOLO (pular prompts de aprovação)
`/fast`	Alternar o Fast Mode — processamento prioritário para modelos OpenAI e Anthropic (v0.9.0+)¹⁶
`/debug`	Diagnóstico rápido em todas as plataformas (v0.9.0+)¹⁶

O comando /model é o principal recurso para trocar de provedor no meio da sessão:⁹

/model                              # Show current model and options
/model claude-sonnet-4              # Switch model (auto-detect provider)
/model zai:glm-5                    # Switch provider:model
/model custom:qwen-2.5              # Use model on custom endpoint
/model custom                       # Auto-detect model from custom endpoint
/model custom:local:qwen-2.5        # Named custom provider
/model openrouter:anthropic/claude-sonnet-4   # Back to cloud

Tools, skills e informações

Comando	Descrição
`/tools [list\\|disable\\|enable] [name...]`	Gerenciar tools para a sessão atual
`/toolsets`	Listar toolsets disponíveis
`/browser [connect\\|disconnect\\|status]`	Gerenciar a conexão local com o Chrome CDP
`/skills`	Buscar, instalar, inspecionar ou gerenciar skills
`/cron`	Gerenciar tarefas agendadas
`/reload-mcp`	Recarregar servidores MCP a partir de config.yaml
`/plugins`	Listar plugins instalados
`/help`	Mostrar todos os comandos
`/usage`	Mostrar uso de tokens, custo e duração
`/insights`	Mostrar analytics de uso (últimos 30 dias)
`/platforms`	Mostrar status das plataformas de mensagens
`/profile`	Mostrar o nome do profile ativo e a home

Comandos slash dinâmicos de skill

Toda skill instalada é automaticamente exposta como um comando slash:⁹

/gif-search funny cats
/axolotl help me fine-tune Llama 3 on my dataset
/github-pr-workflow create a PR for the auth refactor
/excalidraw       # Just the skill name loads it and lets the agent ask what you need

Você também pode definir comandos rápidos em config.yaml, que criam um alias de um nome curto para um prompt mais longo:⁹

quick_commands:
  review: "Review my latest git diff and suggest improvements"
  deploy: "Run the deployment script at scripts/deploy.sh and verify the output"
  morning: "Check my calendar, unread emails, and summarize today's priorities"

Então digite /review, /deploy ou /morning no CLI.

Correspondência por prefixo

Os comandos aceitam correspondência por prefixo: digitar /h resolve para /help, /mod resolve para /model. Quando um prefixo é ambíguo, o primeiro registro na ordem do registro vence. Nomes completos de comandos e aliases registrados sempre têm prioridade sobre correspondências por prefixo.⁹

Comandos específicos de mensagens

Alguns comandos só funcionam em plataformas de mensagens (Telegram, Discord, Slack, WhatsApp, Signal, Email, Home Assistant):⁹

/status — mostrar informações da sessão
/sethome (alias /set-home) — marcar o chat atual como home da plataforma
/approve [session|always] — aprovar um comando perigoso pendente
/deny — rejeitar um comando perigoso pendente
/update — atualizar o Hermes Agent para a versão mais recente
/commands [page] — navegar por todos os comandos e skills (paginado)

E alguns são exclusivos do CLI: /skin, /tools, /toolsets, /browser, /config, /cron, /skills, /platforms, /paste, /statusbar, /plugins.⁹

Tools e toolsets

Hermes vem com um amplo registro de ferramentas integrado que cobre busca na web, automação de navegador, execução no terminal, edição de arquivos, memória, delegação, treinamento de RL, entrega de mensagens, integração com Home Assistant e mais.¹⁰ As ferramentas são organizadas em toolsets lógicos que podem ser ativados ou desativados por plataforma.

Categorias de alto nível

Categoria	Exemplos	Descrição
Web	`web_search`, `web_extract`	Busque na web e extraia o conteúdo de páginas
Terminal e arquivos	`terminal`, `process`, `read_file`, `patch`	Execute comandos e manipule arquivos
Browser	`browser_navigate`, `browser_snapshot`, `browser_vision`	Automação interativa de navegador com texto e visão
Mídia	`vision_analyze`, `video_analyze`, `video_generate`, `image_generate`, `text_to_speech`	Análise e geração multimodal. `video_analyze` prioriza Gemini, com suporte extensível para provedores multimodais compatíveis (v0.13.0+). A v0.14.0 adiciona `video_generate` unificado com backends de provedor plugáveis e envia pixels brutos por `vision_analyze` quando o modelo ativo tem capacidade de visão.¹⁸¹⁹
Orquestração de agentes	`todo`, `clarify`, `execute_code`, `delegate_task`	Planejamento, esclarecimento, execução de código, delegação para subagent
Uso do computador	`computer_use`	Controle de desktop via backend cua-driver; a v0.14.0 faz isso funcionar com provedores com capacidade de visão que não sejam Anthropic.¹⁹
Memória e recuperação	`memory`, `session_search`	Memória persistente + busca na sessão
Automação e entrega	`cronjob`, `send_message`	Tarefas agendadas, envio de mensagens
Integrações	`ha_`, ferramentas MCP, `rl_`	Home Assistant, MCP, treinamento de RL

Nomes comuns de toolsets incluem web, terminal, file, browser, vision, image_gen, moa, skills, tts, todo, memory, session_search, cronjob, code_execution, delegation, clarify, homeassistant e rl.¹⁰

Gerenciamento de ferramentas

hermes chat --toolsets "web,terminal"       # Use specific toolsets
hermes tools                                # Interactive per-platform tool config
hermes tools --summary                      # Print enabled-tools summary

As ferramentas também podem ser alternadas no meio da sessão via /tools disable <name> e /tools enable <name>, o que redefine a sessão para que o novo conjunto de ferramentas entre em vigor.⁹

Backends de terminal

A ferramenta de terminal pode executar comandos em 6 ambientes diferentes:¹⁰

Backend	Caso de uso
`local`	Execute na sua máquina (padrão) — desenvolvimento, tarefas confiáveis
`docker`	Contêineres isolados — segurança, reprodutibilidade
`ssh`	Servidor remoto — sandbox, manter o agente longe do próprio código
`singularity`	Contêineres HPC — computação em cluster, sem root
`modal`	Execução serverless na nuvem
`daytona`	Workspace de sandbox na nuvem — ambiente de desenvolvimento remoto persistente

Troque de backend com hermes config set terminal.backend <name> ou em config.yaml:

terminal:
  backend: docker      # or: local, ssh, singularity, modal, daytona
  cwd: "."             # Working directory
  timeout: 180         # Command timeout in seconds

Backend SSH (recomendado para segurança — o agente não consegue modificar o próprio código):¹⁰

terminal:
  backend: ssh

# In ~/.hermes/.env
TERMINAL_SSH_HOST=my-server.example.com
TERMINAL_SSH_USER=myuser
TERMINAL_SSH_KEY=~/.ssh/id_rsa

Backend Docker:

terminal:
  backend: docker
  docker_image: python:3.11-slim

Recursos do contêiner (aplica-se a docker, singularity, modal, daytona):¹⁰

terminal:
  container_cpu: 1
  container_memory: 5120          # MB (default 5GB)
  container_disk: 51200           # MB (default 50GB)
  container_persistent: true      # Persist filesystem across sessions

Com container_persistent: true, pacotes instalados, arquivos e configuração sobrevivem entre sessões.¹⁰

Todos os backends de contêiner são executados com reforço de segurança: sistema de arquivos raiz somente leitura (Docker), todas as capabilities do Linux removidas exceto DAC_OVERRIDE, CHOWN e FOWNER, sem escalonamento de privilégios, limites de PID (256 processos), isolamento completo de namespace, workspace persistente via volumes.¹⁰

Processos em segundo plano

A ferramenta de terminal oferece suporte à execução em segundo plano com gerenciamento explícito de processos:¹⁰

terminal(command="pytest -v tests/", background=true)
# Returns: {"session_id": "proc_abc123", "pid": 12345}

process(action="list")                            # Show all running processes
process(action="poll", session_id="proc_abc123")  # Check status
process(action="wait", session_id="proc_abc123")  # Block until done
process(action="log", session_id="proc_abc123")   # Full output
process(action="kill", session_id="proc_abc123")  # Terminate
process(action="write", session_id="proc_abc123", data="y")  # Send input

O modo PTY (pty=true) habilita ferramentas interativas CLI como Codex e Claude Code.¹⁰

Sudo

Se um comando precisar de sudo, o Hermes pedirá sua senha (armazenada em cache durante a sessão). Ou defina SUDO_PASSWORD em ~/.hermes/.env.¹⁰

Kanban multiagente (v0.13.0+)

A v0.13.0 transforma a colaboração multiagente em um primitivo de primeira classe: um quadro Kanban durável que acompanha tarefas, status e identidade do worker entre agentes e reinicializações.¹⁸ O quadro é o que faz um enxame de workers do Hermes realmente concluir trabalho em vez de travar em passagens de bastão mortas.

Mecanismo	O que ele faz
Heartbeats	Cada worker pulsa enquanto é dono de uma tarefa. Um heartbeat perdido marca o worker como suspeito e libera a tarefa para recuperação.
Reclaim	Um worker diferente pode assumir uma tarefa abandonada, com o estado completo da tarefa e a saída parcial anterior.
Detecção de zumbis	Workers que saem sem marcar uma tarefa como concluída são bloqueados automaticamente para reivindicar novo trabalho, impedindo que o enxame acumule identidades mortas.
Gate de alucinação	A saída que falha no gate devolve a tarefa ao quadro com um motivo registrado, em vez de marcá-la como concluída.
`max_retries` por tarefa	Substitua o orçamento padrão de tentativas em uma tarefa que você sabe que é frágil.
Quadros multiprojeto	Uma home do Hermes pode hospedar vários quadros independentes.

O quadro Kanban combina naturalmente com /goal (loop Ralph de alvo bloqueado) no lado do alvo e com a ferramenta delegate_task existente para semântica de spawn. O resultado é um padrão de enxame em que todos os agentes compartilham uma única fonte da verdade sobre o que fazer em seguida, quem está fazendo e o que está travado.

Sistema de skills

Skills são documentos de conhecimento sob demanda que o agent pode carregar quando necessário. Elas seguem um padrão de divulgação progressiva para minimizar o uso de tokens e são compatíveis com o padrão aberto agentskills.io.¹¹

Todas as skills ficam em ~/.hermes/skills/ — o diretório principal e a fonte da verdade. Em uma instalação nova, as skills incluídas são copiadas do repo. Skills instaladas pelo Hub e criadas pelo agent também vão para cá.¹¹

Divulgação progressiva

Level 0: skills_list()           → [{name, description, category}, ...]   (~3k tokens)
Level 1: skill_view(name)        → Full content + metadata                 (varies)
Level 2: skill_view(name, path)  → Specific reference file                 (varies)

O agent só carrega o conteúdo completo da skill quando realmente precisa dele.¹¹

Formato de SKILL.md

---
name: my-skill
description: Brief description of what this skill does
version: 1.0.0
platforms: [macos, linux]      # Optional — restrict to OS platforms
metadata:
  hermes:
    tags: [python, automation]
    category: devops
    fallback_for_toolsets: [web]     # Conditional activation
    requires_toolsets: [terminal]    # Conditional activation
    config:                          # Config.yaml settings
      - key: my.setting
        description: "What this controls"
        default: "value"
        prompt: "Prompt for setup"
---

# Skill Title

## When to Use
Trigger conditions for this skill.

## Procedure
1. Step one
2. Step two

## Pitfalls
- Known failure modes and fixes

## Verification
How to confirm it worked.

Ativação condicional

Skills podem se mostrar ou se ocultar com base nas ferramentas disponíveis. Isso é mais útil para skills de fallback — alternativas gratuitas ou locais que só devem aparecer quando uma ferramenta premium está indisponível:¹¹

Campo	Comportamento
`fallback_for_toolsets`	Skill oculta quando os toolsets listados estão disponíveis
`fallback_for_tools`	Igual, mas verifica ferramentas individuais
`requires_toolsets`	Skill oculta quando os toolsets listados estão indisponíveis
`requires_tools`	Igual, mas verifica ferramentas individuais

Exemplo: a skill integrada duckduckgo-search usa fallback_for_toolsets: [web]. Quando você tem FIRECRAWL_API_KEY definido, o toolset web fica disponível e o agent usa web_search — a skill DuckDuckGo permanece oculta. Sem a chave API, a skill DuckDuckGo aparece automaticamente como fallback.¹¹

Skills gerenciadas pelo agent

O agent pode criar, atualizar e excluir suas próprias skills por meio da ferramenta skill_manage. Esta é a memória procedural do agent — quando ele descobre um workflow não trivial, salva a abordagem como uma skill para reutilização futura.¹¹

Quando o agent cria skills:¹¹ - Depois de concluir uma tarefa complexa (5+ chamadas de ferramenta) com sucesso - Quando encontrou erros ou becos sem saída e descobriu o caminho que funcionava - Quando o usuário corrigiu sua abordagem - Quando descobriu um workflow não trivial

Ações:¹¹

Ação	Use para
`create`	Nova skill do zero
`patch`	Correções direcionadas (preferível — mais eficiente em tokens)
`edit`	Grandes reescritas estruturais
`delete`	Remover uma skill por completo
`write_file`	Adicionar/atualizar arquivos de apoio
`remove_file`	Remover um arquivo de apoio

Skill Hub

Navegue, pesquise, instale e gerencie skills de registros online:⁶¹¹

hermes skills browse                          # Browse all hub skills
hermes skills browse --source official        # Browse official optional skills
hermes skills search kubernetes               # Search all sources
hermes skills search react --source skills-sh # Search skills.sh directory
hermes skills inspect openai/skills/k8s       # Preview before installing
hermes skills install openai/skills/k8s       # Install with security scan
hermes skills install skills-sh/anthropics/skills/pdf --force
hermes skills check                           # Check for upstream updates
hermes skills update                          # Reinstall changed hub skills
hermes skills audit                           # Re-scan installed hub skills
hermes skills uninstall k8s
hermes skills publish skills/my-skill --to github --repo owner/repo
hermes skills tap add myorg/skills-repo       # Add custom GitHub source

Fontes de hub integradas:¹¹

Fonte	Exemplo	Observações
`official`	`official/security/1password`	Skills opcionais enviadas com Hermes (confiança builtin)
`skills-sh`	`skills-sh/vercel-labs/agent-skills/vercel-react-best-practices`	Diretório público de skills da Vercel
`well-known`	`well-known:https://mintlify.com/docs/.well-known/skills/mintlify`	Descoberta baseada em URL a partir de sites que publicam `/.well-known/skills/index.json`
`github`	`openai/skills/k8s`	Instalações diretas de repo/caminho GitHub
`clawhub`	—	Marketplace de skills de terceiros
`claude-marketplace`	—	Manifests de plugin/marketplace compatíveis com Claude
`lobehub`	—	Conversão do catálogo de agents LobeHub

Taps GitHub padrão (navegáveis sem configuração): openai/skills, anthropics/skills, VoltAgent/awesome-agent-skills, garrytan/gstack.¹¹

Varredura de segurança

Todas as skills instaladas pelo hub passam por um scanner de segurança que verifica exfiltração de dados, prompt injection, comandos destrutivos, sinais de supply chain e outras ameaças.¹¹

Níveis de confiança:¹¹

Nível	Fonte	Política
`builtin`	Enviadas com Hermes	Sempre confiáveis
`official`	`optional-skills/` no repo	Confiança builtin, sem aviso de terceiros
`trusted`	Registros confiáveis (`openai/skills`, `anthropics/skills`)	Política mais permissiva
`community`	Todo o resto	Achados não perigosos podem ser substituídos com `--force`; vereditos `dangerous` continuam bloqueados

--force pode substituir bloqueios de política não perigosos para skills da comunidade. Ele não substitui um veredito de varredura dangerous.¹¹

Diretórios externos de skills

Você pode apontar o Hermes para diretórios adicionais de skills verificados junto com o diretório local:¹¹

skills:
  external_dirs:
    - ~/.agents/skills
    - /home/shared/team-skills
    - ${SKILLS_REPO}/skills

Os caminhos aceitam expansão de ~ e substituição de variáveis de ambiente ${VAR}. Diretórios externos são somente leitura — quando o agent cria ou edita uma skill, ele sempre grava em ~/.hermes/skills/. A precedência local vence se o nome de uma skill existir nos dois lugares.¹¹

memória persistente

Hermes tem uma memória limitada e curada que persiste entre sessões. Dois arquivos compõem a memória do agente, ambos armazenados em ~/.hermes/memories/:¹²

arquivo	finalidade	limite de caracteres
`MEMORY.md`	Notas pessoais do agente — fatos do ambiente, convenções, aprendizados	2.200 caracteres (~800 tokens)
`USER.md`	Perfil do usuário — preferências, estilo de comunicação, expectativas	1.375 caracteres (~500 tokens)

Ambos são injetados no prompt do sistema como um snapshot congelado no início da sessão. O agente gerencia a própria memória por meio da ferramenta memory — add, replace ou remove.¹²

Padrão de snapshot congelado: a injeção no prompt do sistema é capturada uma vez no início da sessão e nunca muda no meio dela. Isso é intencional — preserva o cache de prefixo do LLM para desempenho. Alterações feitas durante uma sessão são persistidas no disco imediatamente, mas só aparecem no prompt do sistema na próxima sessão.¹²

O que salvar

Salve estes itens (o agente faz isso proativamente):¹² - Preferências do usuário: “Prefiro TypeScript em vez de JavaScript” → user - Fatos do ambiente: “Este servidor roda Debian 12 com PostgreSQL 16” → memory - Correções: “Não use sudo para comandos Docker; o usuário está no grupo docker” → memory - Convenções: “O projeto usa tabs, largura de linha de 120 caracteres e docstrings no estilo Google” → memory - Trabalho concluído: “Migrou o banco de dados de MySQL para PostgreSQL em 2026-01-15” → memory

Ignore estes itens:¹² - Informações triviais/óbvias - Fatos fáceis de redescobrir - Despejos de dados brutos (grandes demais para a memória) - Efêmeros específicos da sessão - Informações que já estão em arquivos de contexto

Busca de sessões

Além de MEMORY.md e USER.md, o agente pode pesquisar conversas anteriores usando a ferramenta session_search. Todas as sessões de CLI e mensagens são armazenadas em SQLite (~/.hermes/state.db) com busca de texto completo FTS5. As consultas retornam conversas anteriores relevantes com sumarização do Gemini Flash.¹²

recurso	memória persistente	busca de sessões
capacidade	~1.300 tokens no total	Ilimitada (todas as sessões)
velocidade	Instantânea (no prompt do sistema)	Exige busca + sumarização do LLM
caso de uso	Fatos-chave sempre disponíveis	Encontrar conversas anteriores específicas
gerenciamento	Curada manualmente pelo agente	Automático — todas as sessões são armazenadas
custo em tokens	Fixo por sessão (~1.300 tokens)	Sob demanda

Provedores externos de memória

Para uma memória persistente mais profunda além de MEMORY.md e USER.md, Hermes vem com oito plugins de provedores externos de memória: Honcho, OpenViking, Mem0, Hindsight, Holographic, RetainDB, ByteRover e Supermemory.¹²

Provedores externos rodam junto com a memória integrada (nunca a substituem) e adicionam capacidades como grafos de conhecimento, busca semântica, extração automática de fatos e modelagem de usuário entre sessões:⁶¹²

hermes memory setup         # Pick a provider and configure it
hermes memory status        # Check what's active
hermes memory off           # Disable external provider (built-in only)

Apenas um provedor externo pode estar ativo por vez. A memória integrada está sempre ativa.⁶

Retomada automática de sessão (v0.13.0+)

A v0.13.0 torna interrupções no meio da atuação do agente recuperáveis. O gateway retoma automaticamente sessões interrompidas após uma reinicialização; reinicializações via /update preservam o estado da sessão durante a atualização; recarregamentos de arquivos-fonte durante o desenvolvimento mantêm a sessão ativa viva em vez de forçar uma nova.¹⁸ Efeito prático: trabalhos longos no gateway e tarefas acionadas por cron não redefinem mais a janela de contexto quando o processo reinicia.

Checkpoints v2 (v0.13.0+)

A persistência de estado foi reescrita na v0.13.0 como um design de armazenamento único com poda real, limites de disco e nenhum repositório sombra órfão.¹⁸ O sistema de checkpoint anterior acumulava estado em disco em profiles de longa duração; o armazenamento v2 coloca um limite rígido no armazenamento local de checkpoints e remove a escrituração duplicada que causava esse crescimento. Nenhuma mudança de configuração voltada ao usuário é necessária; a próxima gravação de checkpoint usa o caminho v2.

personalidade e SOUL.md

SOUL.md é a identidade principal de uma instância do Hermes. Ele ocupa o slot #1 no prompt do sistema, substituindo a identidade padrão hardcoded.¹³

Hermes cria automaticamente um SOUL.md padrão em ~/.hermes/SOUL.md (ou $HERMES_HOME/SOUL.md para profiles personalizados). Arquivos existentes do usuário nunca são sobrescritos. Hermes só carrega SOUL.md de HERMES_HOME — ele não procura no diretório de trabalho atual. Isso torna a personalidade previsível entre projetos.¹³

O que pertence ao SOUL.md

Use-o para orientações duráveis de voz e personalidade:¹³ - tom - estilo de comunicação - nível de objetividade - estilo padrão de interação - o que evitar estilisticamente - como Hermes deve lidar com incerteza, discordância e ambiguidade

Use-o menos para:¹³ - instruções pontuais de projeto - caminhos de arquivos - convenções de repositório - detalhes temporários de workflow

Esses itens pertencem ao AGENTS.md, não ao SOUL.md.

SOUL.md vs AGENTS.md

Esta é a distinção mais importante no gerenciamento de identidade do Hermes:¹³

SOUL.md — identidade, tom, estilo, padrões de comunicação, comportamento no nível da personalidade.

AGENTS.md — arquitetura do projeto, convenções de código, preferências de ferramentas, workflows específicos do repositório, comandos, portas, caminhos, notas de deploy.

Uma regra útil: se deve acompanhar você em todos os lugares, pertence ao SOUL.md. Se pertence a um projeto, pertence ao AGENTS.md.¹³

Personalidades integradas

Hermes vem com personalidades integradas para as quais você pode alternar com /personality:¹³

nome	descrição
`helpful`	Assistente amigável e de uso geral
`concise`	Respostas breves e diretas ao ponto
`technical`	Especialista técnico detalhado e preciso
`creative`	Pensamento inovador e fora da caixa
`teacher`	Educador paciente com exemplos claros
`kawaii`	Expressões fofas, brilhos, entusiasmo
`catgirl`	Neko-chan com expressões felinas
`pirate`	Capitão Hermes, bucaneiro entendido de tecnologia
`shakespeare`	Prosa de bardo com toque dramático
`surfer`	Vibe tranquila de brother
`noir`	Narração de detetive hard-boiled
`uwu`	Fofura máxima com fala uwu
`philosopher`	Contemplação profunda em cada consulta
`hype`	ENERGIA MÁXIMA

Personalidades personalizadas em config.yaml:¹³

agent:
  personalities:
    codereviewer: >
      You are a meticulous code reviewer. Identify bugs, security issues,
      performance concerns, and unclear design choices. Be precise and constructive.

Depois alterne com /personality codereviewer.

SOUL.md vs `/personality`

SOUL.md é a voz de base. /personality é uma camada de sobreposição no nível da sessão.¹³ Mantenha um SOUL.md padrão pragmático e use /personality teacher para uma conversa de tutoria ou /personality creative para brainstorming.

Nous Tool Gateway (v0.10.0+)

A partir do Hermes Agent v0.10.0 (2026-04-16), assinantes pagos do Nous Portal ganham acesso gerenciado a um conjunto curado de ferramentas usando as credenciais do Portal que já têm — sem chaves API extras para gerenciar.²⁶ O CLI do Hermes em si continua licenciado sob MIT e totalmente open source. O que mudou é que sua autenticação do Portal agora desbloqueia mais do que inferência de modelos.

O que há no gateway

ferramenta	provedor	caso de uso
Busca na web	Firecrawl	Recuperação para agentes que precisam de informações recentes
Geração de imagens	FAL / FLUX 2 Pro	Gerar imagens inline sem configurar uma chave FAL
Text-to-speech	OpenAI TTS	Saída falada em gateways de mensagens
Automação de navegador	Browser Use	Navegação headless e scraping

Como funciona

O gateway é opt-in por ferramenta por meio de um novo campo de configuração use_gateway. Se você tiver credenciais do Portal em hermes auth e habilitar o gateway para uma ferramenta, as chamadas dessa ferramenta serão roteadas pelo Portal. Caso contrário, sua chave API direta (se presente) será usada.

# config.yaml — per-tool gateway opt-in
tools:
  web_search:
    provider: firecrawl
    use_gateway: true          # route via Nous Portal subscription
  image_generation:
    provider: fal
    use_gateway: true

Precedência em runtime: quando o gateway está disponível e uma ferramenta tem use_gateway: true, Hermes prefere o gateway mesmo que você também tenha uma chave API direta configurada. Isso importa para cobrança — chamadas pelo gateway são debitadas da sua assinatura do Portal, não do saldo da sua chave API direta.

Habilitando o gateway

hermes model                      # select Nous Portal (OAuth flow)
hermes tools                      # per-platform tool picker integrates gateway tools
hermes status                     # confirms gateway/subscription detection

Não há um comando separado hermes subscribe ou hermes login --portal. A assinatura é detectada automaticamente a partir das credenciais OAuth do Portal que você já tem em hermes auth.

Preços e acesso

Preços e nomes de planos são publicados na página de preços do Nous Portal (https://portal.nousresearch.com/pricing). Este guia não enumera os planos porque eles são responsabilidade do produto Portal, não do CLI do Hermes, e mudam independentemente dos lançamentos do Hermes. Cadastre-se em https://portal.nousresearch.com/ e confira a página de preços para ver os planos atuais.

Aviso de descontinuação

A variável de ambiente HERMES_ENABLE_NOUS_MANAGED_TOOLS foi removida na v0.10.0. As ferramentas gerenciadas agora são habilitadas pelo campo de configuração use_gateway por ferramenta e controladas pelo estado da sua assinatura do Portal.²⁶

Enquadramento: o que este lançamento não é

O CLI do Hermes Agent não fica bloqueado atrás de uma assinatura. O projeto continua licenciado sob MIT; todos os recursos principais (CLI, skills, memória, messaging gateway, cron, MCP, dashboard local, BYOK para todos os provedores) funcionam de ponta a ponta sem pagar ninguém. A v0.10.0 adiciona um caminho de conveniência para usuários que já pagam pelo Nous Portal — ela não remove nada do caminho gratuito.

Messaging Gateway

Hermes pode ser executado como um processo de gateway de longa duração que se conecta a 22 plataformas de mensagens a partir de um único processo de gateway: Telegram, Discord, Slack, WhatsApp, Signal, SMS, Email, Home Assistant, Mattermost, Matrix, DingTalk, Feishu/Lark, WeCom, Weixin (WeChat), BlueBubbles (iMessage), QQBot, Microsoft Teams, Tencent Yuanbao, Google Chat, LINE, SimpleX Chat e um adaptador genérico de Webhook.³²⁵¹⁷¹⁸¹⁹ A v0.9.0 adicionou iMessage via BlueBubbles (registro automático de webhook, assistente de configuração, resiliência a falhas) e suporte nativo a WeChat via iLink Bot API, com modo de callback do WeCom para apps empresariais.¹⁶ A v0.11.0 adicionou QQBot.²⁵ A v0.12.0 adicionou Microsoft Teams e Tencent Yuanbao.¹⁷ A v0.13.0 adicionou Google Chat como a 20ª plataforma, usando a mesma arquitetura de adaptadores plugáveis; IRC e Microsoft Teams também foram migrados para o novo padrão de adaptadores, com hooks de plugin genéricos env_enablement_fn / cron_deliver_env_var.¹⁸ A v0.14.0 adiciona LINE e SimpleX Chat e completa a stack do Microsoft Teams de ponta a ponta com auth via Graph, listener de webhook, runtime de pipeline e entrega de saída.¹⁹ A v0.17.0 (19 de junho de 2026) adiciona iMessage sem relay via Photon Spectrum (OAuth com código de dispositivo usando hermes photon login — sem exigir Mac/relay do BlueBubbles), o adaptador oficial da WhatsApp Business Cloud API (substituindo a exigência de processo bridge), grupos do SimpleX e anexos nativos, e Raft como plugin de plataforma incluído.²¹

Configuração

hermes gateway setup                # Interactive platform configuration
hermes gateway install              # Install as user service (systemd/launchd)
hermes gateway start                # Start the installed service
hermes gateway stop
hermes gateway restart
hermes gateway status
hermes gateway run                  # Run in foreground (debugging)

A configuração interativa orienta você na conexão de cada plataforma: tokens API, IDs de bot, mapeamentos de canal, allowlists.⁶

Como as mensagens fluem

Dos documentos de arquitetura upstream:³

Platform event → Adapter.on_message() → MessageEvent
  → GatewayRunner._handle_message()
    → authorize user
    → resolve session key
    → create AIAgent with session history
    → AIAgent.run_conversation()
    → deliver response back through adapter

Toda plataforma de mensagens passa pelo mesmo loop de conversa AIAgent que o CLI. É por isso que os comandos slash funcionam de forma idêntica nos dois lugares e por que um cron job agendado no Telegram pode entregar sua saída no Discord — a diferença entre plataformas fica só na borda.³

Autorização e pareamento de usuários

hermes pairing list                    # Show pending and approved users
hermes pairing approve <platform> <code>
hermes pairing revoke <platform> <user-id>
hermes pairing clear-pending

Códigos de pareamento impedem que desconhecidos aleatórios conversem com o seu gateway. Um usuário envia um código de pareamento pela plataforma de mensagens; você aprova com hermes pairing approve; a partir daí, ele fica autorizado.⁶

Tarefas agendadas (Cron)

Hermes tem um sistema de cron de primeira classe em que jobs são tarefas de agente, não comandos de shell. Cada job agendado passa por um AIAgent novo com o prompt configurado, skills anexadas opcionais, e entrega resultados para qualquer plataforma:³⁶

hermes cron list
hermes cron create --prompt "Check HN for AI news and summarize" --schedule "0 9 * * *" --deliver telegram
hermes cron edit <id>
hermes cron pause <id>
hermes cron resume <id>
hermes cron run <id>         # Trigger now on the next tick
hermes cron remove <id>
hermes cron status           # Check if scheduler is running
hermes cron tick             # Run due jobs once and exit

Ou crie um de forma conversacional dentro de um chat de mensagens:

Every morning at 9am, check Hacker News for AI news and send me a summary on Telegram.

O agente vai configurar o cron job por meio das próprias ferramentas. Os jobs persistem em JSON e sobrevivem a reinicializações.³

Integração com MCP

Hermes oferece suporte ao Model Context Protocol tanto como cliente quanto como servidor:⁶

Como cliente — conecte Hermes a servidores MCP externos para expandir sua superfície de ferramentas:

hermes mcp add <name> --url https://example.com/mcp
hermes mcp add <name> --command npx --args "-y,@modelcontextprotocol/server-github"
hermes mcp list
hermes mcp test <name>
hermes mcp remove <name>
hermes mcp configure <name>   # Toggle individual tool selection

Ou manualmente em config.yaml:¹⁴

mcp_servers:
  github:
    command: npx
    args: ["-y", "@modelcontextprotocol/server-github"]
    env:
      GITHUB_PERSONAL_ACCESS_TOKEN: "ghp_xxx"

Como servidor — exponha conversas do Hermes para outros agentes:

hermes mcp serve
hermes mcp serve -v    # Verbose

Compressão de contexto

Hermes comprime automaticamente conversas longas para permanecer dentro da janela de contexto do seu modelo. O resumidor de compressão é uma chamada LLM separada — você pode apontá-lo para qualquer provedor ou endpoint.⁴

compression:
  enabled: true
  threshold: 0.50                           # Compress at this % of context limit
  target_ratio: 0.20                        # Fraction to preserve as recent tail
  protect_last_n: 20                        # Min recent messages to keep uncompressed
  summary_model: "google/gemini-3-flash-preview"
  summary_provider: "auto"                  # "auto", "openrouter", "nous", "codex", "main", etc.
  summary_base_url: null                    # Custom OpenAI-compatible endpoint

Opções de provedor:⁴

`summary_provider`	`summary_base_url`	Resultado
`auto` (padrão)	não definido	Detecta automaticamente o melhor provedor disponível
`nous` / `openrouter` / etc.	não definido	Força esse provedor e usa sua auth
qualquer	definido	Usa diretamente o endpoint customizado (provedor ignorado)

summary_model precisa oferecer uma extensão de contexto pelo menos tão grande quanto a do seu modelo principal, já que ele recebe toda a seção intermediária da conversa para compressão.⁴

Avisos de pressão de orçamento

Quando o agente trabalha em uma tarefa complexa com muitas chamadas de ferramenta, ele pode consumir seu orçamento de iterações (padrão: 90 turnos) sem perceber. A pressão de orçamento avisa automaticamente o modelo:⁴

Limite	Nível	O que o modelo vê
70%	Cuidado	`[BUDGET: 63/90. 27 iterations left. Start consolidating.]`
90%	Aviso	`[BUDGET WARNING: 81/90. Only 9 left. Respond NOW.]`

Timeouts de stream

A conexão de streaming LLM tem duas camadas de timeout que se ajustam automaticamente para provedores locais (localhost, IPs de LAN):⁴

Timeout	Padrão	Provedores locais	Env var
Timeout de leitura de socket	120s	Aumentado automaticamente para 1800s	`HERMES_STREAM_READ_TIMEOUT`
Detecção de stream inativo	180s	Desativada automaticamente	`HERMES_STREAM_STALE_TIMEOUT`
Chamada API (sem streaming)	1800s	Sem alteração	`HERMES_API_TIMEOUT`

O timeout de leitura de socket é aumentado para 30 minutos em endpoints locais porque LLMs locais podem levar minutos no prefill de contextos grandes antes de produzir o primeiro token.⁴

Dashboard web local (v0.9.0+)

Um dashboard baseado em navegador para gerenciar seu Hermes Agent localmente. Configure ajustes, monitore sessões, navegue por skills e gerencie seu gateway sem mexer em arquivos de configuração nem no terminal.¹⁶ Inicie com hermes dashboard. Este é o caminho de onboarding mais fácil para novos usuários que preferem uma GUI.

Monitoramento de processos em segundo plano (v0.9.0+)

watch_patterns permite definir padrões para monitorar a saída de processos em segundo plano e receber notificações em tempo real quando houver correspondência.¹⁶ Monitore erros, espere eventos específicos (“listening on port”) ou acompanhe logs de build — tudo sem polling. Combinado com notify_on_complete da v0.8.0 (que notifica quando uma tarefa em segundo plano termina), Hermes agora tem uma camada completa de observabilidade para processos em segundo plano.¹⁵

Context engine plugável (v0.9.0+)

O gerenciamento de contexto agora é um slot plugável via hermes plugins. Troque por context engines customizados que controlam o que o agente vê a cada turno — filtragem, sumarização ou injeção de contexto específica do domínio.¹⁶ Isso desacopla a estratégia de contexto do loop principal do agente, permitindo customização de contexto por projeto ou por domínio.

Backup e restauração (v0.9.0+)

hermes backup cria um arquivo completo da sua config, sessões, skills e memória. hermes import restaura a partir de um arquivo de backup.¹⁶ Use isso para migrar entre máquinas, criar snapshots antes de grandes mudanças ou compartilhar uma configuração conhecida como boa com colegas de equipe.

Suporte a Termux / Android (v0.9.0+)

Hermes roda nativamente no Android via Termux. Caminhos de instalação adaptados, otimizações de TUI para telas mobile, suporte a backend de voz e comando /image funcionam no próprio dispositivo.¹⁶

Reforço de segurança (v0.13.0+)

A v0.13.0 fechou 8 problemas de segurança P0 e alterou um padrão a favor do usuário.¹⁸ A v0.14.0 vem em seguida com o fechamento de mais 12 P0 e 50 P1, incluindo reforço contra força bruta de sudo / sudo-stdin, correções de bypass de comandos perigosos, sanitização de erros de ferramentas antes da reinjeção no modelo, autenticação API de plugins do dashboard, cobertura de SSRF no skills-hub e varredura de avisos de supply chain durante a instalação.¹⁹

Correção	O que mudou
Redação de segredos ativada por padrão	Antes era opt-in. Logs e uploads de `hermes debug share` redigem segredos, a menos que isso seja desativado explicitamente. A v0.12.0 tinha desativado a redação por padrão após relatos de corrupção de payload; a v0.13.0 reativa isso como a base mais segura.
Bypass de DM entre guilds do Discord (CVSS 8.1)	As allowlists de papéis do Discord agora são limitadas à guild, fechando um caminho em que um papel de usuário em uma guild autorizava DMs em todas elas.
Restrições padrão do WhatsApp	O adaptador do WhatsApp rejeita desconhecidos por padrão e nunca responde em conversa consigo mesmo.
Janela TOCTOU de MCP OAuth	Fechou uma condição de corrida durante o salvamento de credenciais em fluxos de MCP OAuth.
TOCTOU de `auth.json` do CLI	Fechou uma janela TOCTOU análoga no gravador de credenciais do armazenamento de auth do CLI.
Piso de SSRF do navegador	O roteamento híbrido aplica um piso de SSRF contra metadados de nuvem para solicitações que tentam acessar `169.254.169.254` e equivalentes.
Varredura de injeção de prompt no cron	Prompts montados (incluindo conteúdo de skill carregado) são verificados contra prompt injection antes da execução do cron job.
Redação em `hermes debug share`	Uploads de compartilhamento de debug redigem o conteúdo dos logs no momento do upload, não apenas no momento da escrita.

Se você mantém uma implantação do Hermes, trate a v0.13.0 e a v0.14.0 como upgrades relevantes para segurança, não apenas como entregas de recursos. A v0.13.0 fecha o bypass entre guilds do Discord e duas janelas TOCTOU; a v0.14.0 adiciona mais uma rodada de reforço no tratamento de sudo, reinjeção de erros de ferramentas, APIs de plugins, SSRF no skills-hub e avisos de dependências.

Arquitetura para profissionais

Esta seção é para quem quer entender o que acontece por baixo dos panos para poder depurar, estender ou raciocinar sobre performance. É uma síntese da documentação de arquitetura upstream.³

Pontos de entrada → AIAgent

Todo ponto de entrada no Hermes acaba chamando AIAgent.run_conversation():

┌──────────────────────────────────────────────────────────────────┐
│                        Entry Points                              │
│                                                                  │
│  CLI (cli.py)    Gateway (gateway/run.py)    ACP (acp_adapter/)  │
│  Batch Runner    API Server                  Python Library     │
└──────────┬──────────────┬───────────────────────┬────────────────┘
           │              │                       │
           ▼              ▼                       ▼
┌──────────────────────────────────────────────────────────────────┐
│                     AIAgent (run_agent.py)                       │
│                                                                  │
│  ┌─────────────┐  ┌──────────────┐  ┌──────────────┐             │
│  │ Prompt      │  │ Provider     │  │ Tool         │             │
│  │ Builder     │  │ Resolution   │  │ Dispatch     │             │
│  └──────┬──────┘  └──────┬───────┘  └──────┬───────┘             │
│         │                │                 │                    │
│  ┌──────┴───────┐ ┌──────┴───────┐  ┌──────┴───────┐             │
│  │ Compression  │ │ 3 API Modes  │  │ Tool Registry│             │
│  │ & Caching    │ │ chat_compl   │  │ 47 tools     │             │
│  │              │ │ codex_resp   │  │ 20 toolsets  │             │
│  │              │ │ anthropic    │  │              │             │
│  └──────────────┘ └──────────────┘  └──────────────┘             │
└──────────────────────────────────────────────────────────────────┘

Diagrama adaptado da documentação de arquitetura upstream.³

“47 tools / 20 toolsets” versus “28 tools” no seu banner. A contagem de “47 tools” é o total do registro de ferramentas do repositório upstream — todas as ferramentas para as quais o Hermes inclui código-fonte, em todos os toolsets. O seu CLI em execução real vai mostrar um número menor no banner de inicialização (a instalação que verifiquei para este guia informa 28 tools / 89 skills). Isso não é um bug. Muitos toolsets são opt-in e precisam ser ativados explicitamente em config.yaml em toolsets: — adaptadores de plataformas de mensagens, automação de navegador, ferramentas de scraping mais pesadas etc. O total do registro é “o que está disponível”; o número no banner é “o que está ativado no seu profile atual”. Verifique quais toolsets estão ativos com hermes tools --list e ative ou desative toolsets individuais com o bloco toolsets: em ~/.hermes/config.yaml (ou /tools list / /tools enable <name> / /tools disable <name> dentro de uma sessão em execução — remover uma ferramenta aciona um reset da sessão para que o agente reconstrua seu manifesto de ferramentas).

Os três modos API

O Hermes abstrai diferenças entre providers em três modos API, selecionados automaticamente em tempo de execução:³

Modo API	Usado por
`chat_completions`	OpenRouter, z.ai, Kimi, MiniMax, DeepSeek, Alibaba, a maioria dos endpoints customizados, qualquer servidor compatível com OpenAI
`codex_responses`	OpenAI Codex (via ChatGPT OAuth)
`anthropic_messages`	Anthropic API (nativo), Anthropic OAuth, proxies compatíveis com Anthropic

O resolver runtime_provider.py mapeia tuplas (provider, model) para (api_mode, api_key, base_url) para mais de 18 providers, lidando com fluxos OAuth, pools de credenciais e resolução de aliases.³

Fluxo de dados em uma sessão CLI

User input → HermesCLI.process_input()
  → AIAgent.run_conversation()
    → prompt_builder.build_system_prompt()
    → runtime_provider.resolve_runtime_provider()
    → API call (chat_completions / codex_responses / anthropic_messages)
    → tool_calls? → model_tools.handle_function_call() → loop
    → final response → display → save to SessionDB

Da página de arquitetura upstream.³

Ordem de montagem do prompt

A pilha de prompt inclui:¹³

SOUL.md (identidade do agente — ou fallback integrado se indisponível)
Orientação de comportamento sensível a ferramentas
Memória/contexto do usuário (MEMORY.md, USER.md)
Orientação de skills
Arquivos de contexto (AGENTS.md, .cursorrules)
Timestamp
Dicas de formatação específicas da plataforma
Sobreposições opcionais de system prompt, como /personality

SOUL.md é a base — todo o resto é construído sobre ele.¹³

Armazenamento de sessões

Armazenamento de sessões baseado em SQLite com busca de texto completo FTS5. As sessões têm rastreamento de linhagem (pai/filho entre compressões), isolamento por plataforma e escritas atômicas com tratamento de contenção.³

Sistema de plugins

Três fontes de descoberta: ~/.hermes/plugins/ (usuário), .hermes/plugins/ (projeto) e entry points do pip. Plugins registram ferramentas, hooks e comandos CLI por meio de um contexto API. Memory providers são um tipo especializado de plugin em plugins/memory/.³

hermes plugins                       # Interactive enable/disable UI
hermes plugins install <repo>        # Install from Git URL or owner/repo
hermes plugins enable <name>
hermes plugins disable <name>
hermes plugins list

Princípios de design

Da página de arquitetura upstream:³

Princípio	O que significa na prática
Estabilidade do prompt	O system prompt não muda no meio da conversa. Sem mutações que quebrem o cache, exceto ações explícitas do usuário (`/model`)
Execução observável	Toda chamada de ferramenta fica visível para o usuário via callbacks. Atualizações de progresso no CLI (spinner) e no gateway (mensagens de chat)
Interrompível	Chamadas API e execução de ferramentas podem ser canceladas em andamento por entrada do usuário ou sinais
Núcleo agnóstico à plataforma	Uma classe `AIAgent` atende CLI, gateway, ACP, batch e servidor API. As diferenças de plataforma ficam no ponto de entrada
Baixo acoplamento	Subsistemas opcionais (MCP, plugins, memory providers, ambientes de RL) usam padrões de registry e bloqueio por check_fn, não dependências rígidas
Isolamento de profile	Cada profile recebe seu próprio `HERMES_HOME`, configuração, memória, sessões e PID do gateway. Vários profiles rodam simultaneamente

Migração do OpenClaw

Hermes Agent é o sucessor do OpenClaw. Se você está migrando de uma instalação existente do OpenClaw:⁶⁵

hermes claw migrate --dry-run                    # Preview what would be migrated
hermes claw migrate --preset full                # Full migration including API keys
hermes claw migrate --preset user-data --overwrite   # User data only, no secrets
hermes claw migrate --source /custom/path        # Non-default OpenClaw location

hermes claw migrate lê de ~/.openclaw por padrão (também detecta automaticamente diretórios legados ~/.clawdbot e ~/.moldbot) e escreve em ~/.hermes.⁶

Importados diretamente (mais de 30 categorias): SOUL.md, MEMORY.md, USER.md, AGENTS.md, skills de 4 diretórios de origem, modelo padrão, providers customizados, servidores MCP, tokens e allowlists de plataformas de mensagens (Telegram, Discord, Slack, WhatsApp, Signal, Matrix, Mattermost), padrões do agente (esforço de raciocínio, compressão, atraso humano, fuso horário, sandbox), políticas de reset de sessão, regras de aprovação, configuração de TTS, configurações de navegador, configurações de ferramentas, timeout de exec, allowlist de comandos, configuração de gateway e chaves API de 3 fontes.⁶

Arquivados para revisão manual: cron jobs, plugins, hooks/webhooks, backend de memória (QMD), configuração do registry de skills, UI/identidade, logging, configuração multiagente, vínculos de canal, IDENTITY.md, TOOLS.md, HEARTBEAT.md, BOOTSTRAP.md.⁶

A resolução de chaves API verifica três fontes em ordem de prioridade: valores de configuração → ~/.openclaw/.env → auth-profiles.json.⁶

Solução de problemas

“chave API não definida”

Execute hermes model para configurar seu provider interativamente, ou hermes config set OPENROUTER_API_KEY your_key. O comando hermes doctor vai dizer exatamente quais chaves estão faltando.⁷

“Context limit: 2048 tokens” na inicialização (modelos locais)

Hermes detecta automaticamente o tamanho do contexto pelo endpoint /v1/models do seu servidor, mas muitos servidores locais informam padrões baixos. Defina isso explicitamente em config.yaml:²

model:
  default: your-model
  provider: custom
  base_url: http://localhost:11434/v1
  context_length: 32768

Chamadas de ferramenta aparecem como texto em vez de executar

Seu servidor não está com tool calling habilitado, ou o modelo não oferece suporte a isso pela implementação do servidor.²

Servidor	Correção
llama.cpp	Adicione `--jinja` ao comando de inicialização
vLLM	Adicione `--enable-auto-tool-choice --tool-call-parser hermes`
SGLang	Adicione `--tool-call-parser qwen` (ou o parser apropriado)
Ollama	Tool calling vem habilitado por padrão — confira se seu modelo oferece suporte com `ollama show <model>`
LM Studio	Atualize para 0.3.6+ e use um modelo com suporte nativo a tools

As respostas são cortadas no meio da frase

Há 2 causas possíveis:²

Limite baixo de saída (max_tokens) no servidor — SGLang usa 128 tokens por resposta por padrão. Defina --default-max-tokens no servidor ou configure model.max_tokens em config.yaml.
Esgotamento do contexto — O modelo preencheu a janela de contexto. Aumente model.context_length ou habilite a compressão de contexto no Hermes.

“Connection refused” do WSL2 para um servidor de modelo hospedado no Windows

O WSL2 usa um adaptador de rede virtual com sua própria sub-rede — localhost dentro do WSL2 se refere à VM Linux, não ao host Windows. Há 2 opções:²

Rede espelhada (Windows 11 22H2+): edite %USERPROFILE%\.wslconfig:

[wsl2]
networkingMode=mirrored

Depois execute wsl --shutdown e reinicie. Agora localhost funciona nos dois sentidos.

Fallback para IP do host (Windows mais antigo): obtenha o IP do host Windows de dentro do WSL2 e use-o no lugar de localhost:

ip route show | grep -i default | awk '{ print $3 }'
# Use that IP as the base_url host

Você também precisa que o servidor de modelo faça bind em 0.0.0.0, não em 127.0.0.1 — defina OLLAMA_HOST=0.0.0.0 para Ollama, adicione --host 0.0.0.0 para llama-server/SGLang ou habilite “Serve on Network” no LM Studio.²

Onde está tudo?

hermes status e hermes dump são seus aliados aqui. hermes logs list mostra todos os arquivos de log com seus tamanhos. hermes config path imprime o local do arquivo de configuração. hermes config env-path imprime o local do .env.⁶

FAQ

Qual é a diferença entre Hermes Agent e Claude Code?

Claude Code é o CLI oficial da Anthropic, limitado aos modelos da Anthropic. Hermes Agent é um framework de agente open-source da Nous Research que funciona com qualquer provider compatível com OpenAI — Nous Portal, OpenRouter, Anthropic, GitHub Copilot, z.ai, Kimi, MiniMax, DeepSeek, Hugging Face, Google ou seu próprio endpoint auto-hospedado.¹² Hermes também inclui um gateway de mensagens para Telegram/Discord/Slack/WhatsApp/Signal que Claude Code não tem.

Posso usar Hermes com uma chave API da Anthropic?

Sim. Há 3 formas:²

Defina ANTHROPIC_API_KEY em ~/.hermes/.env e execute hermes chat --provider anthropic --model claude-sonnet-4-6
Execute hermes model e selecione Anthropic — Hermes vai usar o armazenamento de credenciais do Claude Code quando disponível
Defina manualmente um ANTHROPIC_TOKEN (setup-token ou token OAuth) como fallback

A opção 2 é preferível se você já usa Claude Code na mesma máquina — ela mantém as credenciais Claude renováveis.

Como alterno providers sem perder minha conversa?

Use /model provider:model dentro de uma sessão. O histórico da conversa, a memória e as skills são preservados:⁹

/model zai:glm-5
/model openrouter:anthropic/claude-sonnet-4
/model custom:local:qwen-2.5

Configurei Anthropic, mas visão/web/compressão não funcionam

Você está caindo no fallback do modelo auxiliar. Visão, resumo da web, compressão e outras tarefas secundárias usam um LLM auxiliar separado — por padrão, Gemini Flash via detecção automática (OpenRouter → Nous → Codex). Se nenhum deles estiver configurado e você só tiver a Anthropic configurada, esses recursos degradam silenciosamente.⁴

Correção: adicione uma OPENROUTER_API_KEY para tarefas auxiliares ou reconfigure os slots auxiliares para usar seu provider principal. Observe que a compressão de contexto fica no próprio bloco de nível superior compression: e recebe summary_provider, não auxiliary.compression.provider — o slot auxiliary.compression expõe apenas um timeout. Correção completa:

auxiliary:
  vision:      { provider: "main" }
  web_extract: { provider: "main" }

compression:
  summary_provider: "main"

Qual é a diferença entre SOUL.md e AGENTS.md?

SOUL.md é a identidade do seu agente — tom, estilo e padrões de comunicação. Ele fica em ~/.hermes/SOUL.md e acompanha você em todos os lugares. AGENTS.md é específico do projeto — arquitetura, convenções, comandos, caminhos — e fica no diretório do seu projeto.¹³ Se deve acompanhar você em todos os lugares, SOUL.md. Se pertence a um projeto, AGENTS.md.

Como executo várias instâncias do Hermes lado a lado?

Profiles. Cada profile tem seu próprio HERMES_HOME, configuração, memória, sessões e PID do gateway:⁶

hermes profile create work --clone
hermes profile use work                 # Sticky default
hermes -p work chat -q "..."            # One-off without switching
hermes profile alias work --name h-work # Wrapper script

Hermes oferece suporte a LLMs locais?

Sim, pelo caminho de endpoint personalizado. Hermes funciona com qualquer servidor compatível com OpenAI: Ollama, vLLM, SGLang, llama.cpp/llama-server, LM Studio, LocalAI, Jan ou o seu próprio.² Veja Endpoints personalizados e auto-hospedados para a configuração por servidor.

O guia cita 47 tools / 20 toolsets do registro de arquitetura upstream — esse é o total completo de tools para as quais o Hermes inclui código-fonte em todos os toolsets. Sua instalação em execução mostra um número menor no banner (a instalação de referência usada neste guia informa 28 tools) porque Hermes habilita apenas o conjunto de toolsets padrão na inicialização. Muitos toolsets são opcionais: adaptadores de gateway de mensagens, automação de navegador, stacks de scraping mais pesadas e várias integrações especializadas precisam ser listadas explicitamente em toolsets: em ~/.hermes/config.yaml antes de serem carregadas. Total do registro = “o que está disponível se você habilitar.” Total do banner = “o que seu profile atual realmente carregou.” Use hermes tools --list para ver quais toolsets estão ativos e quais estão disponíveis, mas desabilitados. Ative ou desative toolsets individuais em runtime com /tools enable <name> e /tools disable <name> (desabilitar dispara um reset da sessão para que o agente reconstrua seu manifesto de tools com o novo formato).

Como Hermes lida com fallback de modelo quando meu provider principal falha?

Configure um bloco fallback_model em config.yaml:²

fallback_model:
  provider: openrouter
  model: anthropic/claude-sonnet-4

Quando o principal falha (limite de taxa, erro do servidor, falha de autenticação), Hermes troca para o fallback no meio da sessão sem perder o histórico da conversa. Dispara no máximo 1 vez por sessão.

O agente pode melhorar suas próprias skills ao longo do tempo?

Sim — essa é a parte “autoaprimorável” do Hermes Agent. O agente pode criar, atualizar e excluir skills pela tool skill_manage. Quando ele descobre um fluxo de trabalho não trivial, salva a abordagem como uma skill para reutilização futura.¹¹ O agente cria skills depois de tarefas complexas (5+ chamadas de tool), quando encontra erros e descobre o caminho que funciona, quando você corrige sua abordagem ou quando descobre um fluxo de trabalho não trivial.

Existe integração com IDE?

Sim — Hermes pode rodar como um servidor ACP (Agent Client Protocol) para VS Code, Zed e JetBrains:⁶

pip install -e '.[acp]'
hermes acp

Changelog

Data	Alteração	Fonte
2026-07-01	Guia v1.10: v0.18.0 “The Judgment Release” (1 de julho de 2026, tag `v2026.7.1`). Adicionada a seção “Novidades no v0.18.0”: backlog P0/P1 completo fechado (~692 itens); Mixture-of-Agents de primeira classe com saída de ensemble rotulada por modelo e streaming ao vivo; contratos de conclusão — `/goal` verifica o próprio trabalho executando verificações do projeto; `/learn` (descreva um workflow → skill reutilizável, em conformidade com CONTRIBUTING.md); `/journey` timeline de memória/skill + grafo de memória no desktop; fan-out de subagentes em background (tarefas delegadas concorrentes); Desktop Projects (projeto/repo/lane); gateway scale-to-zero com coordenação de drain; Google Vertex AI (Gemini via contas de serviço GCP, refresh automático de OAuth2); `/prompt` composer com \$EDITOR. Fonte: releases do hermes-agent.	²²
2026-06-21	Guia v1.9: v0.17.0 “The Reach Release” (19 de junho de 2026, tag `v2026.6.19`). Adicionada a seção “Novidades no v0.17.0”. Mensagens: iMessage sem relay via Photon Spectrum (`hermes photon login`, OAuth por código de dispositivo), adaptador oficial do WhatsApp Business Cloud API (sem bridge), grupos + anexos do SimpleX, plugin de plataforma Raft. Modelos: `z-ai/glm-5.2` (1M), `anthropic/claude-fable-5`, `laguna-m.1`, `nemotron-3-ultra`, `grok-composer-2.5-fast` (OAuth xAI, 200k); padrão xAI → `grok-build-0.1`; modelos adaptativos Anthropic removem o campo `reasoning`. Desktop/dashboard: subagentes em background com watch-windows ao vivo (`delegate_task(background=true)`), criador completo de profiles, Skills Hub reformulado, Automation Blueprints, login 401 seguro, temas do VS Code Marketplace, UI em japonês + chinês tradicional. Skills/ferramentas: edição imagem-para-imagem com `image_generate`, lote atômico de `operations` em `memory`, skill `simplify-code`, booleano `write_approval` (substitui `write_mode`). Arquitetura: handler de elicitação MCP, CronScheduler + Chronos plugáveis, escopo Managed (`/etc/hermes`), relay Gateway-Gateway. Comandos: `/version`, `/billing`, `hermes curator run --consolidate` (opt-in). Segurança: bypass da denylist de shell-escape fechado, adaptadores de aprovação/gateway fail-closed, env de cron sanitizado, secrets redigidos em dumps de debug, triagem de exfiltração stdio MCP, atualizações de CVE urllib3 + PyJWT.	²¹
2026-06-08	Guia v1.8: v0.16.0 “The Surface Release” (5 de junho de 2026, tag `v2026.6.5`). Título do guia atualizado para v0.16 e adicionada a seção “Novidades no v0.16.0”. Destaque: Hermes não é mais apenas terminal. App nativo Hermes Desktop (Electron, macOS/Linux/Windows) com instalação em um clique, autoatualização dentro do app, chat com streaming, arrastar e soltar + colar imagem da área de transferência, paleta `Cmd+K`, arquivo/busca de sessões, seletor de modelo na barra de status, conexão a gateway remoto por WebSocket seguro (OAuth ou usuário/senha, hosts por profile, links `@session` entre profiles) e tradução completa para chinês simplificado via i18n tipado. Painel administrativo no navegador (dashboard web → admin completo): ativar/desativar catálogo MCP, gerenciamento de credenciais, criação de webhook/hook, configuração de memória, controles de gateway, página System com check-before-update + Debug Share, nova página Channels e auth plugável (usuário/senha, OIDC self-hosted, `hermes dashboard register`). Novos comandos: `/undo [N]` (CLI/TUI/mensagens), interface padrão configurável (`cli`/`tui`, `--cli`), `/model` unificado na TUI + overlay Sessions, `hermes portal`, `hermes prompt-size`, `hermes sessions optimize`. Novos modelos: `deepseek-v4-flash`, `MiniMax-M3` (contexto 1M), `qwen3.7-plus`, `gemini-3.5-flash`; OAuth xAI Grok de primeira classe no launcher desktop; seletor fuzzy de modelos; refresh horário do catálogo. Skills: conjunto padrão mais enxuto (Spotify → plugin nativo, Linear → `hermes mcp install linear`, skills mortas removidas), gate de relevância `environments:` (`kanban`/`docker`/`s6`), tap confiável padrão `NVIDIA/skills`, divulgação progressiva (com escopo) de ferramentas MCP/plugin. Segurança: CVE-2026-48710 (Starlette BadHost) fixada em ≥1.0.1; verificações SSRF fora do event loop; bearer token Bedrock removido do env de subprocesso; `bws_cache.json` protegido contra leitura; `docker restart/stop/kill` adicionado aos padrões perigosos; sanitização de unicode invisível. Fechados 2 P0 + 62 P1 (16 com tag de segurança).	²⁰
2026-05-31	Guia v1.7.1: v0.15.1 (29 de maio de 2026, 01:12 UTC) — patch Velocity. Hotfix no mesmo dia pós-Velocity; linha de tag fixada `v2026.5.29`. Corrige o loop de reload 401 do dashboard que afetava implantações em modo loopback. Docker não trata mais `--insecure` como implícito — defina `HERMES_DASHBOARD_INSECURE=1` explicitamente para reativar. Comandos bare MCP (`npx`, `npm`, `node`) voltam a resolver corretamente dentro de containers Docker. Pills de fonte da página Skills e sidebar de categorias renderizam. Workers Kanban respondem limpo a SIGTERM em vez de deixar processos órfãos. Catálogo Skills.sh expandido de 858 para 19.932 entradas via descoberta por sitemap. 28 commits, 21 PRs mesclados, 9 contribuidores. v0.15.2 (29 de maio de 2026, 13:37 UTC) — patch de empacotamento Velocity. Corrige distribuições wheel e sdist para incluir manifests `plugin.yaml`, então instalações via PyPI funcionam sem sideload da árvore de origem. Hotfix apenas de empacotamento, 4 contribuidores.	²³
2026-05-28	Guia v1.7: Adicionado v0.15.0 (28 de maio de 2026) — The Velocity release (tag `v2026.5.28`). Destaque: uma enorme rodada de refatoração + novos primitivos de orquestração. Refatoração da codebase: `run_agent.py` reduzido em 76% (16.083 → 3.821 linhas), distribuído por 14 módulos coesos. Multi-agent Kanban v2: decomposição automática de metas de alto nível em subtarefas, topologia swarm para coordenação paralela de workers, overrides de modelo por tarefa, tarefas agendadas, gerenciamento de worktree. Performance: mais 1 segundo economizado no cold start; redução de 47% em chamadas de função por conversa; `session_search` redesenhado 4.500× mais rápido com a dependência LLM removida (e seu custo API eliminado). Segurança: defesa Promptware protege contra prompt injection da classe Brainworm em três gargalos de segurança; integração com Bitwarden Secrets Manager substitui várias chaves API por provider por um único token de bootstrap. Bundles de skills: carregue várias skills simultaneamente com um comando slash. Orquestrador de sessões TUI: gerenciamento de múltiplas sessões em uma única janela de terminal. Novos providers: suporte a Krea 2 (Medium/Large) e plugin FAL para geração de imagem; rodada de integração xAI adiciona plugin de busca web, upstream OAuth, detecção de modelos aposentados e pausas naturais em TTS. Estatísticas: 1.302 commits, 747 PRs mesclados, 321 contribuidores da comunidade. Segundo as notas de release GitHub, um patch no mesmo dia ou no dia seguinte corrige loop de reload 401 do dashboard, variável de env explícita `--insecure` do Docker, resolução de comandos bare MCP no Docker (`npx`, `npm`, `node`), restauração da página Skills, tratamento de SIGTERM em worker Kanban e o catálogo completo de Skills com 19.932 entradas via sitemap.	²⁴
2026-05-21	Guia v1.6: Adicionado v0.14.0 (16 de maio de 2026) — The Foundation release. Destaque: base de instalação/runtime mais leve, além de superfícies mais amplas de provider, gateway, mídia e verificação. Adicionado OAuth SuperGrok com contexto grok-4.3 1M, `hermes proxy` compatível com OpenAI para providers OAuth, `x_search` de primeira classe, `pip install hermes-agent`, instalações preguiçosas de dependências, lançamento ~19s mais rápido, chamadas CDP de navegador 180x mais rápidas, LINE + SimpleX Chat para 22 plataformas de mensagens, Microsoft Teams de ponta a ponta, `/handoff`, `/subgoal`, botões nativos de esclarecimento no Telegram/Discord, backfill de histórico do Discord, `vision_analyze` em pixel bruto, rodapé verificador de mutação de arquivos por turno, diagnósticos semânticos LSP em toda escrita, `video_generate` unificado, `computer_use` via cua-driver para providers não Anthropic, URLs clicáveis OSC8, suporte ao Zed ACP Registry, roteador OpenRouter Pareto Code, NovitaAI, runtime de app-server Codex, tap confiável `huggingface/skills`, 9 skills opcionais, plugin `ctx.llm` / `tool_override`, busca web Brave/DDGS, renomeação Qwen Cloud, beta nativo para Windows e 12 fechamentos P0 / 50 P1.	¹⁹
2026-05-07	Guia v1.5: Adicionado v0.13.0 (7 de maio de 2026) — The Tenacity release. Destaque: um quadro Kanban multi-agent durável (heartbeat, reclaim, detecção de zombie, gate de hallucination, `max_retries` por tarefa, quadros multiprojeto) que transforma swarms em um primitivo de primeira classe em vez de um padrão de delegação. Comando `/goal` prende o agente a um alvo entre turnos (padrão Ralph-loop como comando slash). Nova ferramenta `video_analyze`, Gemini-first com suporte extensível a modelos compatíveis. Provider xAI Custom Voices TTS com clonagem de voz. i18n em 7 idiomas (zh-Hans, ja, de, es, fr, uk, tr) para mensagens CLI e gateway; docs apenas zh-Hans. Google Chat como 20ª plataforma de mensagens via padrão de adaptador plugável; IRC + Microsoft Teams migrados para o mesmo padrão. `ProviderProfile` ABC + `plugins/model-providers/` para providers terceiros plugáveis sem mudanças no core. Retomada automática de sessão após restart do gateway, `/update` e recarregamento de arquivo-fonte. Reescrita Checkpoints v2 com design de armazenamento único, pruning real e guardrails de disco. Oito fechamentos de segurança P0: redação de secrets ativada por padrão, bypass de DM entre guilds no Discord (CVSS 8.1), rejeição de estranhos + mute de self-chat no WhatsApp, TOCTOU MCP OAuth, TOCTOU `auth.json` CLI, piso SSRF do navegador, varredura de prompt-injection em cron, redação em `hermes debug share`. Linting pós-escrita para Python/JSON/YAML/TOML, modo cron `no_agent` apenas script, allowlists de plataforma em Slack/Telegram/Mattermost/Matrix/DingTalk, melhorias MCP (transporte SSE, encaminhamento OAuth, tags MEDIA de imagem). Estatísticas desde v0.12.0: 864 commits, 588 PRs mesclados, 829 arquivos alterados, 295 contribuidores da comunidade, 282 issues fechadas (13 P0, 36 P1).	¹⁸
2026-05-06	Guia v1.4: Adicionado v0.12.0 (30 de abril de 2026) — The Curator release. Destaque: um Curator autônomo em background rodando no ticker cron do gateway (ciclo padrão de 7 dias) que avalia a biblioteca de skills por rubric, remove skills mortas, consolida skills relacionadas e escreve relatórios por execução — Hermes se mantém entre sessões ativas. Loop de autoaperfeiçoamento atualizado com avaliação baseada em rubric, viés de atualização ativa, herança correta de runtime e toolsets com escopo restritos a memória e skills. Quatro novos providers de inferência: GMI Cloud, Azure AI Foundry, OAuth MiniMax e Tencent Tokenhub. LM Studio promovido a primeira classe. Manifests de catálogo de modelos remotos agora são atualizados automaticamente sem releases. Duas novas plataformas de mensagens: Microsoft Teams (19ª, via arquitetura de gateway plugável) e Tencent Yuanbao (18ª, texto + mídia nativos). Spotify nativo via OAuth PKCE com skill incluída; plugin Google Meet para chamadas e transcrição; provider Piper local TTS. ComfyUI v5 + TouchDesigner-MCP passaram de opcionais para incluídos por padrão. Novas skills: Humanizer, claude-design, design-md, airtable. Adições CLI: modo one-shot `hermes -z`, preflight `hermes update --check`, comando slash `/reload-skills`, estilos plugáveis de indicador de ocupado. Cold start visível da TUI reduzido em ~57% via inicialização preguiçosa do agente e imports preguiçosos. Segurança: redação de secrets desativada por padrão para evitar corrupção de payload; blocklist rígida para comandos irrecuperáveis. Estatísticas: 1.096 commits, 550 PRs mesclados, 213 contribuidores da comunidade.	¹⁷
2026-04-25	Guia v1.3: Adicionado v0.11.0 (23 de abril de 2026) — The Interface release. Reescrita completa em React/Ink da TUI interativa com backend Python JSON-RPC (`tui_gateway`); composer fixo, streaming ao vivo com suporte a clipboard OSC-52, chaves estáveis de picker, barra de status com cronômetro por turno e branch git, confirmação de `/clear`, preset de tema claro, overlay de observabilidade de spawn de subagente. Arquitetura de transporte plugável — conversão de formato e transporte HTTP extraídos para `agent/transports/` para plumbing de provider mais limpo. AWS Bedrock nativo via Converse API. Cinco novos caminhos de inferência: NVIDIA NIM, Arcee AI, Step Plan, Google Gemini CLI OAuth e Vercel ai-gateway. GPT-5.5 via OAuth Codex — o novo flagship da OpenAI agora é acessível por OAuth ChatGPT Codex sem uma chave API separada. QQBot (17ª plataforma de mensagens) com configuração por QR-scan e streaming. Expansão da superfície de plugins: comandos slash, despacho de ferramentas, bloqueio de execução, transformação de resultados. `/steer <prompt>` — ajustes no agente durante a execução que injetam uma nota que o agente em execução vê após sua próxima chamada de ferramenta, sem interromper o turno nem quebrar o cache de prompt. Shell hooks conectam scripts como hooks de ciclo de vida sem plugins Python. Modo de entrega direta por webhook encaminha payloads direto para um chat de plataforma, contornando o agente para fan-out. Delegação mais inteligente com papéis de orquestrador, profundidade de spawn configurável e coordenação de arquivos. Dashboard ganha sistema de plugins, troca de tema ao vivo, i18n e responsividade mobile. Estatísticas desde v0.9.0: 1.556 commits, 761 PRs mesclados, 1.314 arquivos alterados, 224.174 inserções, 29 contribuidores da comunidade.	²⁵
2026-04-16	Guia v1.2: Adicionado v0.10.0 — Nous Tool Gateway. Assinantes pagos do Nous Portal agora acessam ferramentas gerenciadas (busca web Firecrawl, geração de imagem FAL / FLUX 2 Pro, OpenAI TTS, automação de navegador Browser Use) sem chaves API extras. Opt-in por ferramenta via novo campo de configuração `use_gateway`. O runtime prefere gateway em vez de chaves API diretas quando ambos estão configurados. Variável de env `HERMES_ENABLE_NOUS_MANAGED_TOOLS` removida. CLI Hermes Agent continua licenciado sob MIT e totalmente gratuito.	²⁶
2026-04-13	Guia v1.1: Adicionados recursos do v0.8.0 e v0.9.0. Dashboard web local, modo `/fast`, plataformas iMessage + WeChat (16 no total), monitoramento de processos em background (`watch_patterns`), context engine plugável, `hermes backup`/`hermes import`, Termux/Android, providers xAI + MiMo + Google AI Studio + Qwen, comando `/debug`, hardening abrangente de segurança.	¹⁵ ¹⁶
2026-04-10	Guia v1.0: Release inicial cobrindo Hermes Agent v0.7.0. Auth de providers, configuração, CLI, comandos slash, ferramentas, skills, memória, gateway, cron, MCP, compressão, arquitetura, migração OpenClaw, troubleshooting, FAQ.

Referências

Nous Research, README do projeto “Hermes Agent” no GitHub. Fonte primária para a descrição do produto (agente autoaprimorável, multiprovedor, gateway de mensagens, backends de terminal, evolução de skills, agendador cron, delegação) e o comando de uma linha de “instalação rápida”. ↩↩↩
Nous Research, “AI Providers” na documentação do Hermes Agent. Fonte primária para a lista completa de provedores, métodos de autenticação por provedor (OAuth do Nous Portal, código de dispositivo do Codex, tipos de token do GitHub Copilot, autenticação de três métodos do Anthropic, provedores de IA chineses, roteamento do Hugging Face, endpoints personalizados), os três caminhos de autenticação (chave API em .env, OAuth via hermes model, endpoint personalizado em config.yaml), a sintaxe do comando slash /model (incluindo custom:name:model), templates de configuração do Ollama/vLLM/SGLang/llama.cpp/LM Studio, instruções de rede do WSL2, cadeia de detecção de tamanho de contexto, configuração de modelo de fallback, roteamento inteligente de modelos e provedores personalizados nomeados. Todos os nomes de variáveis de ambiente específicos de provedor, tipos de token, substituições de URL base e identificadores de modelo neste post vêm dessa página. ↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩
Nous Research, “Architecture” no guia do desenvolvedor do Hermes Agent. Fonte primária para o diagrama de visão geral do sistema, estrutura de diretórios, fluxo de dados pelos caminhos de sessão CLI e mensagens de gateway, os três modos API (chat_completions, codex_responses, anthropic_messages), resolução de provedor via runtime_provider.py, persistência de sessão via SQLite + FTS5, lista de plataformas do gateway de mensagens, fontes de descoberta do sistema de plugins, isolamento de profile e os seis princípios de design. ↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩
Nous Research, “Configuration” no guia do usuário do Hermes Agent. Fonte primária para a estrutura do diretório de configuração, a regra config.yaml vs .env (“config.yaml vence para configurações que não são secretas”), a cadeia de precedência de configuração (args CLI → env → config.yaml → .env → padrões), configurações de compressão de contexto (bloco compression.* com threshold, target_ratio, protect_last_n, summary_model, summary_provider, summary_base_url), limites de pressão de orçamento (70% cautela, 90% aviso), timeouts de streaming com ajuste automático para provedor local e o bloco completo de configuração de modelo auxiliar (auxiliary: com slots vision, web_extract, approval, compression, session_search, skills_hub, mcp, flush_memories). A restrição do provedor "main" aos slots auxiliar/compressão/fallback também vem dessa página. ↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩
Nous Research, “Migrate from OpenClaw” nos guias do Hermes Agent. Fonte para o fluxo de migração OpenClaw → Hermes. ↩↩
Nous Research, “referência de comandos CLI” na documentação de referência do Hermes Agent. Fonte primária para todos os comandos CLI de nível superior documentados neste post, incluindo hermes chat, hermes model, hermes gateway, hermes setup, hermes auth, hermes status, hermes cron, hermes webhook, hermes doctor, hermes dump, hermes logs, hermes config, hermes pairing, hermes skills, hermes honcho, hermes memory, hermes acp, hermes mcp, hermes plugins, hermes tools, hermes sessions, hermes insights, hermes claw, hermes profile, hermes completion, hermes update e hermes uninstall. Todas as flags de subcomando, descrições de opções, comportamento do pool de credenciais, sintaxe de filtragem de logs, flags de migração do OpenClaw, comandos de gerenciamento de profile e comandos de instalação de serviço neste post vêm dessa página. ↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩
Nous Research, “Installation” no guia de primeiros passos do Hermes Agent. Fonte primária para o comando de instalação em uma linha, o comportamento do instalador (pré-requisitos, suporte a plataformas, detecção automática do Termux, requisitos de Windows/WSL2), a tabela de extras opcionais, as etapas de instalação manual e os comandos de verificação. ↩↩↩↩↩↩↩
Nous Research, “referência de comandos CLI” — veja especificamente a seção hermes dump, que descreve o formato de saída do comando (cabeçalho, ambiente, identidade, modelo, terminal, chaves API, recursos, serviços, carga de trabalho, substituições de configuração) e seu uso previsto para compartilhar diagnósticos. ↩
Nous Research, “referência de comandos slash” na documentação de referência do Hermes Agent. Fonte primária para todos os comandos slash listados neste post, a arquitetura COMMAND_REGISTRY, a divisão entre CLI e mensagens, comandos slash dinâmicos de skill, comandos rápidos em config.yaml, comportamento de correspondência por prefixo e os comandos somente de mensagens (/status, /sethome, /approve, /deny, /update, /commands). ↩↩↩↩↩↩↩↩↩↩
Nous Research, “Tools & Toolsets” no guia do usuário do Hermes Agent. Fonte primária para a visão geral de categorias de ferramentas, comandos de uso de toolset, os seis backends de terminal (local, docker, ssh, singularity, modal, daytona), configuração de container (cpu, memory, disk, persistent), reforço de segurança para containers, gerenciamento de processos em segundo plano API e suporte a sudo. ↩↩↩↩↩↩↩↩↩↩
Nous Research, “Skills System” no guia do usuário do Hermes Agent. Fonte primária para divulgação progressiva, formato SKILL.md, skills específicas de plataforma, ativação condicional (fallback_for_toolsets, requires_toolsets, fallback_for_tools, requires_tools), skills gerenciadas pelo agente via skill_manage, os comandos e a lista de fontes do skill hub (official, skills-sh, well-known, github, clawhub, claude-marketplace, lobehub), varredura de segurança e níveis de confiança, e diretórios externos de skills. ↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩
Nous Research, “Persistent Memory” no guia do usuário do Hermes Agent. Fonte primária para os limites de caracteres de MEMORY.md / USER.md, o padrão de snapshot congelado, ações da ferramenta de memória (add, replace, remove), o que salvar vs ignorar, a comparação entre memória e busca de sessão, e a lista de oito provedores externos de memória (Honcho, OpenViking, Mem0, Hindsight, Holographic, RetainDB, ByteRover, Supermemory). ↩↩↩↩↩↩↩↩
Nous Research, “Personality & SOUL.md” no guia do usuário do Hermes Agent. Fonte primária para o comportamento de SOUL.md (fica em HERMES_HOME, nunca é sobrescrito, slot nº 1 no prompt do sistema, passa por varredura de segurança antes da inclusão), distinção entre SOUL.md e AGENTS.md, a lista de personalidades integradas (14 personalidades, de helpful a hype), personalidades personalizadas em config.yaml, o padrão de sobreposição /personality e a ordem completa de montagem da pilha de prompts. ↩↩↩↩↩↩↩↩↩↩↩↩
Nous Research, “Use MCP with Hermes” e referência de configuração MCP nos guias e na referência do Hermes Agent. Fonte para o formato de configuração mcp_servers: em config.yaml com campos command, args, env. ↩
Notas de lançamento do Hermes Agent v0.8.0. 8 de abril de 2026. Notificações automáticas de processos em segundo plano, MiMo v2 Pro gratuito no Nous Portal, troca ao vivo de /model entre plataformas, provedor nativo do Google AI Studio, OAuth do Qwen, timeouts baseados em inatividade, botões de aprovação no Slack/Telegram, OAuth 2.1 PKCE do MCP, logging centralizado, expansão do sistema de plugins. ↩↩↩↩↩
Notas de lançamento do Hermes Agent v0.9.0. 13 de abril de 2026. Dashboard web local, Fast Mode (/fast), iMessage via BlueBubbles, WeChat + WeCom, Termux/Android, monitoramento de processos em segundo plano (watch_patterns), provedores nativos xAI + Xiaomi MiMo, context engine plugável, suporte unificado a proxy, reforço de segurança (path traversal, shell injection, SSRF, correções de RCE), hermes backup/hermes import, /debug + hermes debug share, 16 plataformas compatíveis. 487 commits, 269 PRs mesclados, 24 contribuidores. ↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩
Notas de lançamento do Hermes Agent v0.12.0. 30 de abril de 2026. “The Curator release.” Curator autônomo em segundo plano que avalia, poda e consolida a biblioteca de skills em um ciclo padrão de 7 dias executado no ticker cron do gateway. Loop de autoaprimoramento atualizado: avaliação baseada em rubrica, viés de atualização ativa, herança correta de runtime, toolsets com escopo restritos a memória e skills. Quatro novos provedores de inferência: GMI Cloud, Azure AI Foundry, OAuth do MiniMax, Tencent Tokenhub. LM Studio promovido a primeira classe. Manifestos remotos do catálogo de modelos são atualizados automaticamente sem releases. Duas novas plataformas de mensagens: Microsoft Teams (19ª, via arquitetura de gateway plugável) e Tencent Yuanbao (18ª, texto + mídia nativos). Spotify nativo via OAuth PKCE com skill incluída; plugin do Google Meet para chamadas e transcrição; provedor TTS local Piper. ComfyUI v5 + TouchDesigner-MCP incluídos por padrão. Novas skills: Humanizer, claude-design, design-md, airtable. CLI: modo one-shot hermes -z, preflight hermes update --check, comando slash /reload-skills, estilos plugáveis de indicador de ocupado. Inicialização a frio da TUI reduzida em ~57% via inicialização preguiçosa. Segurança: redação de segredos desativada por padrão; blocklist rígida para comandos irrecuperáveis. Estatísticas desde v0.11.0: 1.096 commits, 550 PRs mesclados, 213 contribuidores da comunidade. Veja também: tag de release v2026.4.30. ↩↩↩
Notas de lançamento do Hermes Agent v0.13.0. 7 de maio de 2026. “The Tenacity release.” Quadro Kanban multiagente com heartbeat, reclaim, detecção de zombie, gate de alucinação, max_retries por tarefa, quadros multiprojeto. Comando slash /goal para travar metas entre turnos (primitiva do loop Ralph) com orçamento de turnos configurável. Ferramenta video_analyze, Gemini-first com extensibilidade multimodal compatível. Provedor TTS xAI Custom Voices com clonagem de voz. i18n em 7 idiomas: zh-Hans, ja, de, es, fr, uk, tr (CLI + mensagens de gateway; docs apenas zh-Hans). Google Chat como 20ª plataforma de mensagens via padrão de adaptador plugável com hooks genéricos de plugin env_enablement_fn / cron_deliver_env_var; IRC e Microsoft Teams migrados para o mesmo padrão. ABC ProviderProfile + plugins/model-providers/ para provedores terceirizados plugáveis. Retomada automática de sessão após reinício do gateway, /update e recarregamento de arquivos-fonte. Reescrita dos checkpoints v2 para armazenamento único com poda real, proteções de disco, sem repositórios shadow órfãos. Oito fechamentos de segurança P0: redação de segredos ativada por padrão, bypass de DM entre guilds no Discord (CVSS 8.1, allowlists de função com escopo por guild), WhatsApp rejeita estranhos por padrão + nunca responde em chat consigo mesmo, TOCTOU de salvamento de credenciais OAuth do MCP, TOCTOU de auth.json do CLI em gravadores de credenciais, piso de SSRF de cloud metadata do navegador em roteamento híbrido, varredura de prompt montado por cron (incluindo conteúdo de skill) contra prompt injection, redação de conteúdo de log do hermes debug share no momento do upload. Outros itens notáveis: linting pós-gravação para Python/JSON/YAML/TOML, modo watchdog cron no_agent somente script, allowlists de plataforma em Slack/Telegram/Mattermost/Matrix/DingTalk, melhorias de MCP (transporte SSE, encaminhamento de OAuth, resultados de imagem como tags MEDIA). Estatísticas desde v0.12.0: 864 commits, 588 PRs mesclados, 829 arquivos alterados, 295 contribuidores da comunidade, 282 issues fechadas (13 P0, 36 P1). ↩↩↩↩↩↩↩↩↩↩↩↩
Notas de lançamento do Hermes Agent v0.14.0. 16 de maio de 2026. “The Foundation release.” Desde v0.13.0: 808 commits, 633 PRs mesclados, 1.393 arquivos alterados, 165.061 inserções, 545 issues fechadas (12 P0, 50 P1) e 215 contribuidores da comunidade. Adiciona OAuth do SuperGrok com grok-4.3 e contexto de 1M, hermes proxy, x_search, empacotamento PyPI, dependências preguiçosas, cache de prompt Claude de 1h entre sessões, lançamento ~19s mais rápido, chamadas CDP do navegador 180x mais rápidas, LINE e SimpleX Chat para 22 plataformas de mensagens, /handoff, botões nativos de esclarecimento, backfill de histórico do Discord, vision_analyze de pixels brutos, rodapé verificador de mutação de arquivo por turno, diagnósticos semânticos LSP, video_generate unificado, computer_use do cua-driver, links OSC8, suporte ao Zed ACP Registry, roteador OpenRouter Pareto Code, NovitaAI, runtime app-server do Codex, huggingface/skills, plugin ctx.llm, tool_override, busca Brave/DDGS, reforço contra comandos perigosos, /subgoal, renomeação do Qwen Cloud, beta nativo para Windows, 16 locales no total e atualizações amplas de documentação/testes. ↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩
Notas de lançamento do Hermes Agent v0.16.0, “The Surface Release,” tag v2026.6.5, publicadas em 2026-06-06T00:55:58Z (data da tag de release: 5 de junho de 2026); mais recente em 2026-06-08. Novo Hermes Desktop nativo (Electron, macOS/Linux/Windows; conexão com gateway remoto por WebSocket seguro com OAuth ou usuário/senha; hosts remotos por profile; links @session entre profiles; UI em chinês simplificado via i18n tipado, display.language). Dashboard web expandido para um painel administrativo completo (alternâncias de catálogo MCP, gerenciamento de credenciais, criação de webhook/hook, configuração de memória, controles de gateway, página System com check-before-update + Debug Share, página Channels; auth plugável incl. OIDC auto-hospedado e hermes dashboard register). Novos comandos: /undo [N], interface padrão configurável (cli/tui, --cli), /model na TUI + sobreposição de Sessions, hermes portal, hermes prompt-size, hermes sessions optimize. Novos modelos: deepseek-v4-flash, MiniMax-M3 (contexto de 1M), qwen3.7-plus, gemini-3.5-flash; OAuth do xAI Grok; seletor fuzzy; atualização horária de catálogo. Skills: conjunto padrão mais enxuto, gate de relevância environments:, tap confiável padrão NVIDIA/skills, divulgação progressiva de ferramentas, correção de falso sucesso de OAuth do MCP. Segurança: CVE-2026-48710 (Starlette BadHost) fixado em ≥1.0.1, verificações SSRF fora do event loop, token bearer do Bedrock removido do env de subprocesso, bws_cache.json protegido contra leitura, adições de padrões perigosos para docker restart/stop/kill, sanitização de unicode invisível; 2 P0 + 62 P1 fechados (16 com tag de segurança). Enquadramento de marketing das notas de lançamento (contagens de PR/commit, “nada disso existia uma semana atrás”) excluído; apenas fatos concretos de recurso/versão ligados à tag são registrados. Verificação da sessão atual em 8 de junho de 2026. ↩↩↩↩↩↩↩↩
Notas de lançamento do Hermes Agent v0.17.0, “The Reach Release,” tag v2026.6.19, 19 de junho de 2026; mais recente em 2026-06-21. Mensagens: iMessage via Photon Spectrum (OAuth por código de dispositivo, hermes photon login, sem relay de Mac); adaptador oficial WhatsApp Business Cloud API (substitui processo bridge); grupos SimpleX, anexos nativos, agrupamento de texto, autoaceite; plugin de plataforma Raft incluído. Modelos/provedores: z-ai/glm-5.2 (contexto de 1M), anthropic/claude-fable-5, laguna-m.1, nemotron-3-ultra, grok-composer-2.5-fast (OAuth xAI, contexto de 200k); padrão xAI → grok-build-0.1; modelos adaptativos Anthropic usam o contrato moderno de thinking (sem campo reasoning). CLI/slash: /version, /billing, hermes photon login, hermes curator run --consolidate (opt-in), GUI do hermes model, clonagem de profile. Desktop: janelas de observação de subagentes em segundo plano (delegate_task(background=true)), seletor de modelo Composer, atalhos reconfiguráveis, notificações nativas do SO, rascunhos por thread, temas do VS Code Marketplace, UI em japonês + chinês tradicional. Dashboard: construtor completo de profile, alternador global de profile, reformulação do Skills Hub com varredura de segurança, Automation Blueprints, login seguro (401 atrás de OAuth). Skills/ferramentas: edição imagem-para-imagem image_generate entre provedores, lote atômico operations de memory, skill simplify-code de revisão paralela, booleano write_approval substitui write_mode. Arquitetura: subagentes em segundo plano (handle retornado imediatamente, resultado reentra como um turno), handler de elicitação MCP para confirmação no meio de chamada de ferramenta, ferramentas MCP conectadas tarde expostas entre turnos, CronScheduler plugável + cron gerenciado Chronos, escopo Managed (/etc/hermes fixado por admin), relay Gateway-Gateway. Segurança: bypass da denylist de escape de shell fechado, fail-closed em módulo de aprovação ausente e adaptadores de gateway com política própria, env de script de job cron sanitizado, segredos redigidos em debug dumps, metadata de host omitida do status público, triagem de padrões de exfiltração em stdio MCP, bumps de CVE em urllib3 + PyJWT. Enquadramento de marketing do release (contagens de commit/PR) excluído. Verificação da sessão atual em 21 de junho de 2026. ↩↩↩↩↩↩↩↩↩↩↩
Notas de lançamento do Hermes Agent v0.18.0 (tag v2026.7.1), 1 de julho de 2026 — “The Judgment Release.” Varredura do backlog prioritário (todos os P0/P1 fechados, ~692 itens em doze dias); Mixture-of-Agents selecionável como modelo de primeira classe em todas as interfaces, com a saída completa de cada modelo de referência renderizada como seu próprio bloco rotulado e streaming de resposta ao vivo; contratos de conclusão para /goal (agente verifica o próprio trabalho executando checks do projeto); comando /learn (transforme qualquer coisa em uma skill reutilizável descrevendo-a, com conformidade automática com CONTRIBUTING.md); linha do tempo visual /journey de memória/skill com edição e grafo de memória no desktop; fan-out de subagentes em segundo plano (várias tarefas delegadas simultâneas); Desktop Projects (modelo projeto/repo/lane); gateway scale-to-zero com coordenação de drain; suporte ao Google Vertex AI (Gemini via contas de serviço GCP, atualização automática de token OAuth2); comando /prompt com $EDITOR. Verificação da sessão atual em 1 de julho de 2026 (PST) na página de releases do GitHub; v0.18.0 é o release mais recente. ↩↩↩↩↩↩↩↩↩↩↩
Notas de lançamento do Hermes Agent v0.15.1 e notas de lançamento do Hermes Agent v0.15.2. v0.15.1 (29 de maio de 2026, 01:12 UTC) é o hotfix Velocity do mesmo dia: correção do loop de recarregamento 401 do dashboard em modo loopback; Docker agora exige HERMES_DASHBOARD_INSECURE=1 explícito; comandos bare do MCP (npx, npm, node) resolvem em containers Docker; pills de fonte + sidebar de categorias da página Skills restaurados; workers Kanban respondem a SIGTERM; catálogo Skills.sh cresceu de 858 para 19.932 entradas via sitemap. 28 commits, 21 PRs mesclados, 9 contribuidores. v0.15.2 (29 de maio de 2026, 13:37 UTC) é um hotfix apenas de empacotamento que inclui manifestos plugin.yaml em distribuições wheel e sdist para que instalações via PyPI funcionem sem sideload do código-fonte. 4 contribuidores. ↩
Notas de lançamento do Hermes Agent v0.15.0 e a página de releases do Hermes Agent. “The Velocity release,” tag v2026.5.28. Estatísticas: 1.302 commits, 747 PRs mesclados, 321 contribuidores da comunidade. Refatora run_agent.py em 76% (16.083 → 3.821 linhas em 14 módulos). Adiciona a plataforma Kanban multiagente (decomposição automática, topologia de swarm, substituições de modelo por tarefa, tarefas agendadas, gerenciamento de worktree). session_search redesenhado 4.500× mais rápido com a dependência LLM removida. Defesa Promptware contra prompt injection da classe Brainworm em três gargalos de segurança. Integração com Bitwarden Secrets Manager substitui várias chaves API por provedor por um único token de bootstrap. Pacotes de skills permitem carregar várias skills com um comando slash. Orquestrador de sessões TUI para gerenciamento multissessão em uma janela de terminal. Krea 2 (Medium/Large) e suporte ao plugin FAL para geração de imagens. Rodada de integração xAI adiciona plugin de busca web, upstream OAuth, detecção de modelos aposentados e pausas TTS naturais na saída de voz. Um patch release referenciado no GitHub aborda loop de recarregamento 401 do dashboard, --insecure do Docker exigindo var env explícita HERMES_DASHBOARD_INSECURE=1, resolução de comandos bare do MCP (npx, npm, node) em Docker, renderização da página Skills, tratamento de SIGTERM do worker Kanban, catálogo Skills completo com 19.932 entradas via sitemap e um pequeno lote de entrega de .md, segurança de probe do gateway, redação de URL web, capacidade de visão do kanban-worker e padrões de observação hindsight. ↩
Notas de lançamento do Hermes Agent v0.11.0. 23 de abril de 2026. “The Interface release” — reescrita completa em React/Ink do CLI interativo com backend JSON-RPC Python (tui_gateway); arquitetura de transporte plugável (agent/transports/); AWS Bedrock nativo via Converse API; cinco novos caminhos de inferência (NVIDIA NIM, Arcee AI, Step Plan, OAuth do Google Gemini CLI, Vercel ai-gateway); GPT-5.5 via OAuth do Codex; QQBot como 17ª plataforma de mensagens com configuração por QR scan; superfície de plugin expandida (comandos slash, despacho de ferramentas, bloqueio de execução, transformação de resultados); /steer <prompt> para direcionamentos do agente no meio da execução que injetam contexto após a próxima chamada de ferramenta sem quebrar o cache de prompt; hooks de shell para eventos de ciclo de vida sem plugins Python; modo de entrega direta por webhook que encaminha payloads direto para um chat de plataforma; delegação mais inteligente com papéis de orquestrador + profundidade de spawn configurável + coordenação de arquivos; sistema de plugins do dashboard, troca de tema ao vivo, i18n, responsividade mobile. Estatísticas desde v0.9.0: 1.556 commits · 761 PRs mesclados · 1.314 arquivos alterados · 224.174 inserções · 29 contribuidores da comunidade. Veja também: tag de release GitHub do Hermes Agent v0.11.0. ↩↩↩
Notas de lançamento do Hermes Agent v0.10.0. 16 de abril de 2026. “The Tool Gateway Release.” Integração do Nous Tool Gateway para assinantes pagos do Nous Portal — acesso gerenciado a busca web Firecrawl, geração de imagens FAL / FLUX 2 Pro, OpenAI TTS e automação de navegador Browser Use sem chaves API extras. Opt-in por ferramenta via novo campo de configuração use_gateway. Em runtime, o gateway é preferido em vez de chaves API diretas quando ambos estão configurados. Integração completa com hermes tools e hermes status. Substitui a var env obsoleta HERMES_ENABLE_NOUS_MANAGED_TOOLS. Implementação por @jquesnelle (emozilla). O CLI do Hermes Agent continua licenciado sob MIT e totalmente open source; o gateway é uma integração com o produto de assinatura Portal existente, não um paywall no CLI. Veja também: Nous Portal para preços de assinatura e cadastro. ↩↩↩