HTML é o formato que os agentes de IA querem
Em 8 de maio de 2026, Thariq Shihipar, engenheiro que trabalha no Claude Code na Anthropic, publicou em seu site pessoal uma coleção com 20 artefatos em HTML produzidos por um agente em nove categorias de trabalho de conhecimento. O argumento era simples: quando a resposta carrega estrutura espacial, interação ou evidência visual, HTML supera Markdown.12
HTML supera Markdown como formato de saída de agentes porque estrutura espacial, interação e evidência visual carregam informações que a prosa achata. O formato emitido pelo agente é a superfície de controle que a pessoa inspeciona, não uma embalagem ao redor dela.
O post saiu seis dias antes de um artigo publicado no arXiv em 14 de maio mostrar que a qualidade da busca de agentes vive no ambiente de execução, não no recuperador.3 O mesmo padrão aparece: formato e ambiente de execução são a base, não a embalagem. O componente só importa depois que a superfície ao redor dele transforma a saída do modelo em algo que uma pessoa consegue verificar.
Resumo
Thariq Shihipar publicou um site complementar com 20 exemplos em HTML cobrindo revisão de código, design systems, prototipagem, exploração, diagramas, pesquisa, relatórios e superfícies de edição.1 A tese: Markdown lineariza informações que chegam de forma espacial. Diffs, grafos de chamada, comparações lado a lado e protótipos interativos carregam significado que a prosa achata. A era de lançamento do GPT-4, com 8K tokens, empurrou Markdown como padrão eficiente em tokens; a documentação atual sobre janelas de contexto do Claude lista modelos de 200K e 1M tokens, o que muda a conta para muitos tamanhos de artefato.45 Para stacks web sem build e renderizadas no servidor, como FastAPI mais HTMX, o post oferece o argumento do lado do agente: HTML é o formato que o modelo quer produzir e o formato que o navegador já renderiza. Passar por Markdown adiciona uma etapa de tradução que perde fidelidade nas duas pontas.6
Principais conclusões
Para quem cria agentes: - Pare de usar Markdown por padrão para a saída de agentes quando a resposta for uma comparação, um diff, um fluxograma ou uma estrutura navegável. Peça HTML e deixe o agente se comprometer com um layout espacial.1 - Trate o formato de saída do modelo como parte da superfície da ferramenta. Um único artefato renderizado é mais inspecionável do que uma transcrição que passa rolando pela tela.7
Para designers de interface: - HTML é o meio em que seu design system já é entregue. Passar por Markdown introduz uma etapa de tradução que perde fidelidade, seguida de outra etapa de tradução na renderização.1 - A superfície de controle é aquilo que o agente produz. Se a pessoa não consegue ver o que o agente viu, a superfície está quebrada.7
Para equipes que usam stacks sem build e renderizadas no servidor: - A aposta em HTML em vez de um pipeline de build agora tem validação do lado do agente. O formato que o modelo quer produzir e o formato que o navegador já renderiza são o mesmo.6 - Um site renderizado no servidor remove uma camada de tradução duas vezes: uma na etapa de build, outra na etapa de saída do agente. As duas remoções se somam.
O que Thariq realmente argumentou
Shihipar trabalha no Claude Code na Anthropic; o post está em seu site pessoal, não no blog oficial da Anthropic.2 A galeria complementar contém 20 arquivos independentes em HTML produzidos por um agente, agrupados em nove categorias de trabalho em que HTML supera Markdown estruturalmente.1
Seus argumentos centrais:
| Argumento | Por que isso pesa |
|---|---|
| “Diffs and call-graphs are spatial information; markdown flattens them.” | Um diff lado a lado com anotações codificadas por severidade comunica mais rápido do que uma lista numerada de caminhos de arquivo.1 |
| “HTML is the medium your design system ships in.” | Produzir variantes de componentes em HTML corresponde ao formato que o design system já tem como alvo. Markdown força uma etapa de tradução.1 |
| “Motion and interaction can’t be described, only felt.” | Um protótipo com curvas de easing reais e fluxos clicáveis comunica em segundos o que um parágrafo de prosa não consegue.1 |
| O argumento de eficiência de tokens do Markdown era um artefato de janelas de contexto pequenas. | A era de lançamento do GPT-4 com 8K tokens ficou para trás; a documentação atual sobre janelas de contexto do Claude lista orçamentos muito maiores, de 200K e 1M tokens.45 |
O segundo argumento é o que sustenta tudo para quem constrói infraestrutura web. Se o design system entrega HTML, o agente deve produzir HTML. Qualquer outra coisa introduz uma ida e volta com perda.
Os 20 exemplos são o argumento
As categorias na galeria de Shihipar cobrem o trabalho que muita gente hoje entrega a um agente de código:1
- Revisão de código: diffs anotados com observações em linha codificadas por severidade; mapas de módulos com caminhos de chamada destacados.
- Exploração: abordagens de código lado a lado; opções de design organizadas para seleção, não para leitura sequencial.
- Design: páginas vivas de design system; folhas de variantes de componentes que renderizam as próprias variantes.
- Prototipagem: sandboxes de animação com curvas de easing reais; fluxos interativos que respondem a cliques.
- Diagramas: figuras SVG em linha; fluxogramas anotados; esboços de arquitetura com caixas e setas.
- Pesquisa: seções recolhíveis; explicadores de conceitos interativos com demonstrações ao vivo.
- Relatórios: linhas do tempo e gráficos formatados em que a estrutura carrega o significado.
- Editores: interfaces customizadas com funcionalidade de exportação incorporada ao artefato.
Cada exemplo é uma página em HTML que o modelo produziu de uma vez. O padrão comum: a resposta é espacial ou interativa, e o artefato renderizado preserva aquilo que uma resposta em Markdown teria que descrever em prosa.
Por que o padrão era Markdown
Markdown virou o padrão de saída de agentes por dois motivos que já não se sustentam do mesmo jeito.
Primeiro, a geração do GPT-3.5 e do GPT-4 esbarrava em janelas de contexto na faixa de 4K a 8K durante o período em que a convenção de saída em chat se consolidou.4 A concisão do Markdown era uma restrição real: um token gasto em <div class="..."> era um token a menos para análise. A documentação atual sobre janelas de contexto do Claude lista contextos de 200K tokens para muitos modelos e de 1M tokens para Opus 4.1 e Sonnet 4.6.5 Para muitos artefatos de inspeção, o argumento de eficiência de tokens perdeu força.
Segundo, renderizadores de terminal e janelas de chat renderizam Markdown de forma trivial, enquanto HTML exige uma webview ou uma aba do navegador. A conveniência da superfície manteve Markdown como caminho de menor resistência mesmo depois que o argumento dos tokens enfraqueceu.
O post de Shihipar tem peso porque o autor trabalha no Claude Code na Anthropic. Os 20 exemplos são artefatos concretos, não afirmações abstratas.2 A cobertura de Simon Willison no mesmo dia reproduziu o padrão com uma explicação de exploit de segurança em Linux renderizada como uma página interativa em HTML, em vez de um texto em Markdown.8
O que HTML preserva e Markdown descarta
Quatro propriedades sustentam o argumento:
| Propriedade | Como Markdown lida | Como HTML lida |
|---|---|---|
| Relações espaciais | Lineariza em títulos e listas | Preserva como layout, colunas e painéis lado a lado |
| Interação | Descreve em prosa (“clique aqui para expandir”) | Incorpora via eventos reais do DOM e transições CSS |
| Densidade sem rolagem | Rolagem longa, sem pontos de salto além dos títulos | Seções recolhíveis, âncoras na página, navegação flutuante |
| Hierarquia visual | Depende do modelo mental do leitor sobre os títulos | Depende do layout que o olho realmente percorre |
Cada propriedade corresponde a uma classe de tarefa de agente que fica mais difícil quando você achata a saída em prosa. Um diff é uma comparação espacial; um fluxograma é um grafo; uma revisão de design system é um julgamento visual. Forçar tudo isso por Markdown pede que o leitor reconstrua o que o renderizador poderia ter mostrado.
A conexão com o ambiente de execução
A qualidade da busca de agentes vive no ambiente de execução, não no recuperador. Aquele post argumentou que o método de recuperação importa menos do que a estrutura ao redor dele: forma do prompt, superfície das ferramentas, formatação da transcrição, entrega dos resultados e comportamento de nova tentativa.3
O argumento de HTML estende o mesmo enquadramento para a saída. O modelo pode produzir a resposta certa em qualquer formato. O formato que você pede faz parte do contrato do ambiente de execução. Formatos diferentes produzem superfícies verificáveis diferentes:
- Entrega em Markdown: o usuário lê de cima a baixo, decide o que importa e reconstrói a estrutura mentalmente.
- Entrega em HTML: o modelo se compromete com uma estrutura, o renderizador torna essa estrutura fácil de escanear, e o usuário inspeciona em vez de apenas ler.
Mesmos dados, superfície de controle diferente. Design agêntico é design de superfície de controle. O formato que o agente emite faz parte dessa superfície, não é uma embalagem ao redor dela.7
O que isso significa para o stack sem build
O guia de FastAPI mais HTMX neste site defende HTML renderizado no servidor em vez de um pipeline de build JavaScript.6 O post de Shihipar fornece o argumento do lado do agente:
- O modelo quer produzir HTML.
- O navegador quer renderizar HTML.
- Inserir Markdown ou JSX entre eles adiciona duas etapas de tradução com perda.
Um site sem build renderizado no servidor remove a tradução em tempo de build. Produzir HTML diretamente a partir do agente remove a tradução em tempo de saída. O ganho composto: o mesmo formato passa do modelo para a rota e para o navegador sem formas intermediárias.
Isso não significa que React ou Markdown estejam errados em todos os casos. Significa que o custo das etapas de tradução agora é visível nas duas pontas, e um stack que evita as duas fica proporcionalmente mais simples.
Formato importa. Ambiente de execução importa. Ambos são a base.
O artigo sobre busca de agentes e o post sobre HTML chegaram com oito dias de diferença e defendem a mesma forma de pensar:13
- O recuperador é um componente. O ambiente de execução é a base.
- O modelo é um componente. O formato de saída é a base.
Pensar em componentes continua oferecendo melhorias locais: trocar o recuperador, adicionar memória, substituir o modelo, refinar o prompt. Pensar na base muda a superfície que o usuário vê e a superfície que o agente produz. As descobertas desta semana empurram o trabalho para o segundo enquadramento.
O movimento prático: quando a resposta de um agente carrega informação espacial, peça HTML. Quando o agente roda em uma estrutura de execução, instrumente essa estrutura antes de instrumentar o modelo. Os dois movimentos se somam. Nenhum deles é uma solução mágica isoladamente.
FAQ
A Anthropic publicou este post?
Não. Thariq Shihipar publicou o texto em seu site pessoal, thariqs.github.io/html-effectiveness/.1 Ele trabalha no Claude Code na Anthropic, então o sinal de autoridade é forte, mas o post não é uma publicação da Anthropic.2
O argumento se aplica a toda tarefa de agente?
Não. O post mira explicitamente trabalhos em que estrutura espacial, interação ou evidência visual carregam significado. Para respostas factuais curtas ou saídas presas ao terminal, Markdown continua sendo um bom padrão.1
E o custo de tokens?
O argumento de custo a favor do Markdown estava ligado a janelas de contexto pequenas. A documentação atual sobre janelas de contexto do Claude lista modelos de 200K e 1M tokens, o que muda a relação entre a verbosidade de HTML e os tamanhos de artefato que o post apresenta.5
Isso quebra os padrões atuais de Markdown do Claude Code?
Não. O argumento é sobre a saída que você pede ao modelo sob demanda para inspeção, não sobre a transcrição ou a saída do terminal. Você ainda pode pedir HTML em um único prompt e receber de volta um artefato autocontido.1
Como isso se conecta ao artigo sobre ambiente de execução na busca de agentes?
Os dois argumentos apontam para a base ao redor do modelo, não para o modelo em si. A qualidade da busca depende da estrutura de execução; a qualidade da saída depende do formato. O componente é necessário; a base é o que torna o componente confiável.3
O que uma equipe de FastAPI mais HTMX deve fazer com isso?
Trate HTML como um destino de saída de primeira classe para qualquer recurso de IA que você lançar. O mesmo formato passa do modelo para a rota e para o navegador, e o stack sem build já otimiza esse caminho.6
Referências
-
Thariq Shihipar, “A eficácia irracional de HTML,” site pessoal, 8 de maio de 2026. Fonte primária dos 20 artefatos em HTML, das nove categorias de trabalho (exploração, revisão de código, design, prototipagem, diagramas, pesquisa, relatórios, editores), do argumento sobre informação espacial (“diffs and call-graphs are spatial information; markdown flattens them”), da afirmação sobre design system (“HTML is the medium your design system ships in”), da afirmação sobre interação (“motion and interaction can’t be described, only felt”) e da posição de que HTML preserva a agência do usuário em loops de agentes. ↩↩↩↩↩↩↩↩↩↩↩↩↩
-
Thariq Shihipar, site pessoal. Fonte para a declaração de Shihipar de que ele atualmente trabalha no Claude Code na Anthropic e para a origem, em site pessoal, do artigo sobre HTML. ↩↩↩↩
-
Sahil Sen, Akhil Kasturi, Elias Lumer, Anmol Gulati, Vamse Kumar Subbiah, “Só Grep basta? Como estruturas de agentes remodelam a busca agêntica,” arXiv:2605.15184v1, enviado em 14 de maio de 2026. Fonte para o enquadramento ambiente de execução versus componente aplicado à busca de agentes em Chronos, Claude Code, Codex CLI e Gemini CLI em um subconjunto de 116 perguntas do LongMemEval-S. ↩↩↩↩
-
OpenAI, “Pesquisa do GPT-4,” OpenAI, 14 de março de 2023. Fonte para o tamanho de contexto de lançamento do GPT-4, de 8.192 tokens, e para o acesso limitado à variante
gpt-4-32k, com contexto de 32.768 tokens. ↩↩↩ -
Anthropic, “Janelas de contexto,” Claude API Docs. Fonte para a documentação atual de que Opus 4.1 e Sonnet 4.6 têm janela de contexto de 1M tokens, enquanto outros modelos Claude, incluindo Sonnet 4.5 e Sonnet 4, têm janela de contexto de 200K tokens. ↩↩↩↩
-
Blake Crosley, “FastAPI + HTMX: o full-stack sem build,” guia do blakecrosley.com, atualizado em 15 de maio de 2026. Fonte para o argumento da arquitetura sem build renderizada no servidor, incluindo a afirmação de que HTMX elimina o pipeline de build JavaScript enquanto produz pontuações Lighthouse de 100/100/100/100. ↩↩↩↩
-
Blake Crosley, “Design agêntico é design de superfície de controle,” blog do blakecrosley.com, 15 de maio de 2026. Fonte para o enquadramento de superfície de controle: design agêntico como a disciplina de tornar software autônomo visível, interrompível, inspecionável e digno de confiança, com o formato de saída como parte dessa superfície. ↩↩↩
-
Simon Willison, “Usando Claude Code: a eficácia irracional de HTML,” simonwillison.net, 8 de maio de 2026. Cobertura secundária e contexto adicional sobre o post de Shihipar, incluindo o exemplo trabalhado de uma explicação de exploit de segurança em Linux renderizada como uma página HTML ricamente interativa. ↩