Artigos científicos precisam de arquivos de afirmações legíveis por agentes
Em 15 de maio de 2026, Arquimedes Canedo propôs o paper.json: um arquivo JSON complementar que permite a um artigo científico expor, ao lado do PDF, IDs estáveis de afirmações, limites explícitos de escopo, comandos de reprodução por figura e IDs estáveis de definições.1
Esse pequeno arquivo aponta para um problema grande.
Agentes de pesquisa já leem artigos, extraem afirmações, citam fontes, reproduzem figuras, criam trabalhos derivados e resumem escopo.1 A prosa ainda atende leitores humanos. Mas, sozinha, ela dá aos agentes espaço demais para citar a subafirmação errada, generalizar além das evidências, inventar comandos de reprodução ou reconstruir uma definição de memória.
Artigos científicos precisam de arquivos de afirmações legíveis por agentes. Um artigo deve oferecer aos agentes uma superfície tipada para mostrar o que afirma, o que não afirma, como os termos principais funcionam e como as evidências se conectam a figuras e código.
Resumo rápido
Arquivos de afirmações legíveis por agentes transformam um artigo de um artefato apenas em prosa em um artigo acompanhado de uma superfície de evidências endereçável. O PDF continua sendo o objeto para humanos. O arquivo de afirmações dá aos agentes IDs estáveis, limites de escopo, definições e comandos de reprodução.
A proposta do paper.json defende essa ideia com um schema concreto e um repositório de exemplo. O rascunho descreve cinco convenções: IDs estáveis de afirmações, uma lista explícita do que o artigo não afirma, comandos de shell exatos por figura, conformidade mínima viável por meio de um único arquivo JSON escrito manualmente e IDs estáveis de definições.1 O repositório complementar inclui paper.json, schema.json, validator.py, resolve.py, o PDF e o código-fonte em Typst.2
O conjunto mais amplo de pesquisas sobre agentes aponta na mesma direção. O Argus trata pesquisa profunda como montagem de evidências, não como busca paralela por força bruta.3 ACDL dá aos contextos de agentes uma linguagem formal de descrição.4 Pesquisas sobre exploração mostram que agentes precisam de pontos de verificação verificáveis antes de agir.5 Trabalhos sobre arquitetura projetada por agentes aumentam a importância da reprodutibilidade no nível do artigo quando agentes geram afirmações científicas.6
A regra prática: publique a prosa para humanos e o arquivo de afirmações para agentes.
Principais pontos
Para autores de artigos: - Adicione IDs estáveis para afirmações, definições, teoremas, figuras e trabalhos futuros. - Escreva limites de escopo como campos de primeira classe, não como prosa defensiva escondida perto do fim.
Para revisores: - Verifique se as afirmações legíveis por máquina correspondem ao artigo, não apenas se o schema é validado. - Trate arquivos de afirmações desatualizados ou exagerados como defeitos com risco de citação.
Para construtores de agentes de pesquisa: - Busque o arquivo de afirmações antes de resumir, citar, reproduzir ou construir algo em cima de um artigo. - Cite IDs de afirmações e IDs de definições quando uma tarefa depender de escopo exato.
Para periódicos e repositórios: - Aceite um arquivo simples ao lado do PDF antes de pedir que autores adotem uma plataforma completa. - Valide a estrutura automaticamente e deixe a revisão semântica para humanos e agentes especializados.
Por que artigos em prosa falham com agentes de pesquisa?
A prosa acadêmica compacta evidências em uma narrativa.
Essa narrativa ajuda humanos. Um leitor atento consegue acompanhar ressalvas, comparar seções, inferir qual resultado sustenta qual afirmação e perceber onde o artigo para. Agentes muitas vezes processam artigos de outro jeito. Eles varrem, fragmentam, recuperam, citam, resumem e compõem novos artefatos sob limites de tempo e contexto.
Isso cria modos de falha previsíveis.
| Superfície apenas em prosa | Falha do agente |
|---|---|
| A afirmação aparece dentro de um parágrafo | O agente cita a subafirmação errada ou cita o artigo inteiro. |
| O limite de escopo aparece na discussão | O agente transforma um resultado limitado em uma afirmação geral. |
| O comando da figura fica em um repositório | O agente inventa um comando plausível ou pula a reprodução. |
| A definição aparece uma vez | O agente reconstrói o termo de forma imprecisa depois. |
| O trabalho futuro fica na prosa | O agente trata uma pergunta em aberto como resultado provado. |
Canedo nomeia várias dessas falhas diretamente: subafirmações não têm identificadores de citação abaixo do nível do artigo, a expansão indevida de escopo passa por resumos em prosa, e comandos de figuras muitas vezes ficam fora do artigo, em repositórios de código.1
A solução não exige substituir o artigo. A solução exige adicionar uma interface que torne as afirmações do artigo mais fáceis de endereçar.
O que um arquivo de afirmações deve conter?
Um arquivo de afirmações legível por agentes deve expor as partes que agentes mais costumam usar mal.
| Campo | Trabalho do agente |
|---|---|
id |
Nomear o artigo com um slug estável. |
version |
Informar aos agentes qual superfície de afirmações eles leram. |
claims[] |
Permitir que agentes citem subafirmações por ID estável. |
does_not_claim[] |
Bloquear extrapolação de escopo antes que um resumo se espalhe. |
definitions[] |
Preservar significados escritos pelos autores para termos-chave. |
reproducibility.commands[] |
Dar comandos exatos para figuras, tabelas ou verificações. |
follow_up_work[] |
Separar trabalho futuro das evidências já apresentadas. |
repository |
Dar aos agentes o código e a localização canônica dos arquivos. |
schema |
Permitir que ferramentas validem a estrutura antes do uso. |
O exemplo funcional do paper.json inclui uma versão de rascunho, URL do repositório, metadados de autor, resumo, afirmações, exclusões de escopo, comandos de reprodutibilidade e validação baseada em schema.2 Seu schema exige campos centrais como id, title, version, status, authors, abstract, claims, does_not_claim e reproducibility.2
Estrutura não prova verdade. Estrutura torna a verdade revisável.
Essa distinção importa. O arquivo paper.json afirma explicitamente que um validador aprovado não consegue provar correção semântica, completude ou qualidade da reprodução de figuras.2 Um arquivo de afirmações desatualizado pode causar mais dano do que nenhum arquivo, porque agentes talvez confiem mais em um campo organizado do que em uma prosa bagunçada.
Por isso, o padrão precisa de duas camadas:
- Validação estrutural: o arquivo é analisado corretamente, contém os campos obrigatórios e preserva os IDs declarados?
- Revisão semântica: o arquivo representa o artigo com fidelidade?
Autores podem automatizar a primeira camada. Revisores precisam assumir a segunda.
Por que IDs estáveis de afirmações importam?
Agentes citam de forma ampla demais quando a única unidade endereçável é o artigo inteiro.
Um artigo pode conter uma afirmação de método, uma afirmação de avaliação, uma afirmação de limitação, uma afirmação de benchmark e uma afirmação de trabalho futuro. Um leitor humano consegue citar o artigo e explicar qual parte importa. Um agente muitas vezes transforma essa citação do artigo inteiro em um token vago de autoridade.
IDs estáveis de afirmações dão aos agentes um alvo menor.
| Alvo de citação | Resultado |
|---|---|
| Artigo inteiro | “O artigo mostra X.” |
| Título de seção | “A seção de método diz X.” |
| ID estável de afirmação | “A afirmação C2 afirma X sob o limite de escopo Y.” |
O rascunho de Canedo relata evidências-piloto para recuperação por IDs de afirmações. Na condição mais difícil de recuperação conceitual, agentes usando afirmações JSON pontuaram 1,20 de 2 em média, enquanto agentes buscando na prosa pontuaram 0,60 de 2.2 O artigo apresenta esse resultado como evidência-piloto, não como prova em escala.2
Essa cautela fortalece a proposta. A ideia não depende de fingir que o primeiro piloto resolveu o campo. A ideia pede que autores criem um objeto de revisão melhor.
IDs de afirmações permitem que revisores façam perguntas mais precisas:
- O agente citou C1 ou o artigo inteiro?
- O resumo preservou o qualificador em C2?
- O sistema posterior construiu algo em cima de C3 sem verificar o comando?
- O agente confundiu um ID de definição com uma afirmação de resultado?
Essas perguntas são melhores do que “o resumo soou certo?”
Por que limites de escopo precisam de um campo próprio?
Agentes frequentemente exageram artigos porque limitações ficam escondidas na prosa.
Um artigo pode dizer que seu benchmark cobre cinco tarefas, que seu método exige um ambiente específico ou que seu resultado não generaliza para além de uma configuração controlada. Um leitor humano consegue manter essa nuance. Um resumo de agente pode perder o qualificador depois de uma reescrita.
Um campo explícito does_not_claim[] torna os limites de escopo visíveis antes da reutilização.
| Limite de escopo escondido | Formato no arquivo de afirmações |
|---|---|
| “Não avaliamos segurança clínica.” | does_not_claim: clinical safety |
| “Nosso método assume que rastreamentos de ferramentas existem.” | does_not_claim: trace-free operation |
| “O piloto usa cinco exemplos.” | does_not_claim: population-level proof |
| “O comando valida apenas a estrutura.” | does_not_claim: semantic correctness |
A proposta do paper.json lista várias exclusões para seu próprio trabalho. Ela não afirma que C1, C2 ou C3 foram provadas, não afirma que o validador garante correção semântica, não afirma que a convenção resolve a leitura por agentes e não afirma compatibilidade com todos os padrões de metadados acadêmicos.2
Essa lista dá aos agentes algo útil: limites que eles podem citar.
Campos de escopo também ajudam avaliadores. Se um resumo de agente diz “paper.json prova que IDs de afirmações melhoram a precisão de citações por agentes”, o avaliador pode comparar a frase com o campo does_not_claim[] e sinalizar extrapolação. Sem um campo, o avaliador precisa inferir o escopo a partir da prosa.
Por que comandos de figuras devem ficar ao lado das afirmações?
A reprodução muitas vezes falha na fronteira do comando.
Muitos artigos apontam para um repositório. O comando exato da figura pode estar em um script, um alvo de Make, um notebook, uma nota no README ou em nenhum lugar óbvio. Um agente pode buscar no repositório e montar um comando que parece plausível. Comandos plausíveis criam uma confiança perigosa quando nunca foram executados.
Um arquivo de afirmações legível por agentes deve listar diretamente os comandos de reprodução.
O exemplo funcional do paper.json inclui comandos para gerar o validador, validar paper.json contra paper.typ e compilar o artigo em Typst para PDF.2 O rascunho de Canedo relata evidências-piloto de que comandos de reprodução fornecidos por JSON melhoraram a recuperação de comandos de figuras em comparação com seções de método em prosa que apontam para um repositório.2
O campo de comando deve permanecer modesto:
| Requisito | Motivo |
|---|---|
| Comando exato | Evita fragmentos de shell inventados. |
| Artefato esperado | Permite que agentes verifiquem o formato da saída. |
| Nota de ambiente | Evita suposições sobre dependências ocultas. |
| ID de figura ou tabela | Conecta o comando à evidência do artigo. |
| Não objetivo conhecido | Impede que agentes tratem uma verificação superficial como reprodução completa. |
Agentes não devem tratar um campo de comando como sucesso. O campo de comando dá ao agente um alvo para executar, registrar e relatar.
Onde entram as definições?
Definições podem causar mais dano do que afirmações.
Uma afirmação errada costuma falhar em uma frase. Uma definição errada contamina todas as frases posteriores que usam o termo. Agentes que reconstroem definições a partir da prosa podem criar um vocabulário que soa interno ao artigo, mas se afasta do significado pretendido pelo autor.
IDs estáveis de definições enfrentam esse risco.
A quinta convenção de Canedo dá IDs estáveis às definições, e o rascunho argumenta que definições escritas pelos autores devem prevalecer sobre definições reconstruídas por agentes em reutilizações posteriores.1 O resolvedor do repositório aceita fragmentos como #C1, #D1, #T1 e #F1, mapeando IDs para afirmações, definições, teoremas e itens de trabalho futuro.2
Esse mecanismo importa para sistemas posteriores.
| Tarefa posterior | Risco de definição |
|---|---|
| Revisão de literatura | O agente funde termos de dois artigos com significados diferentes. |
| Extração de benchmark | O agente trata o nome de uma métrica como se todos os artigos a definissem do mesmo jeito. |
| Geração de código | O agente implementa o objeto errado porque a definição desviou. |
| Experimento de continuidade | O agente otimiza um termo que o autor nunca quis dizer. |
Arquivos de afirmações devem tornar termos endereçáveis. Agentes devem citar ou resolver definições antes de aplicá-las.
Como agentes de pesquisa devem usar arquivos de afirmações?
Agentes precisam de um protocolo de leitura.
Antes de resumir ou citar um artigo, um agente de pesquisa deve:
- Buscar o arquivo de afirmações do artigo quando disponível.
- Validar a estrutura do arquivo.
- Resolver a afirmação, definição, figura, teorema ou ID de trabalho futuro solicitado.
- Conferir o item resolvido com o PDF quando a tarefa tiver consequências reais.
- Preservar limites de escopo em todo resumo.
- Executar comandos de reprodução apenas dentro de um ambiente isolado apropriado.
- Relatar saída de comandos, arquivos ausentes e verificações com falha como evidências.
- Recorrer à prosa apenas quando o arquivo de afirmações não tiver o item necessário.
Esse protocolo deve produzir um pacote de revisão:
| Campo do pacote | Evidência |
|---|---|
| Artigo | Título, versão, repositório e URL do PDF. |
| Arquivo de afirmações | URL, versão, status do schema e saída de validação. |
| IDs resolvidos | IDs de afirmações, definições, figuras ou trabalhos futuros usados. |
| Limites de escopo | Entradas relevantes de does_not_claim[]. |
| Reprodução | Comandos executados, saídas, falhas e ambiente. |
| Verificação humana | Qualquer afirmação que o agente não conseguiu verificar pelo arquivo ou pelo PDF. |
O objetivo não é mais burocracia. O objetivo é menos citações sem suporte.
Como o conjunto mais amplo de pesquisas sobre agentes aponta na mesma direção?
Pesquisas recentes sobre agentes continuam voltando ao mesmo tema: agentes precisam de superfícies estruturadas de evidências, não de mais fluência sem lastro.
O Argus trata pesquisa profunda como montagem de evidências. O sistema usa um Searcher e um Navigator; o Navigator acompanha um grafo compartilhado de evidências e distribui trabalhos de busca para preencher partes ausentes da evidência.3 Esse desenho reforça a necessidade de artigos exporem partes de evidências que agentes possam montar.
ACDL foca descrições de contexto. Os autores argumentam que sistemas de agentes precisam de uma linguagem precisa e legível para descrever como prompts e histórico de interação evoluem ao longo das etapas.4 Arquivos de afirmações fazem um trabalho paralelo na camada do artigo: descrevem como as afirmações, definições e comandos do artigo devem entrar no contexto do agente.
Pesquisas sobre exploração acrescentam outro ângulo. “Look Before You Leap” apresenta Exploration Checkpoint Coverage, uma métrica verificável para saber se um agente descobre estados, objetos e possibilidades de ação importantes antes de agir.5 Agentes de pesquisa precisam da mesma disciplina antes de citar ou reutilizar um artigo. Eles devem descobrir afirmações, definições, limites e comandos antes de agir.
AIRA aumenta a importância disso. O artigo AIRA-Compose e AIRA-Design relata uma busca arquitetural multiagente que propõe novas arquiteturas de modelos-base e ganhos posteriores sobre referências de base.6 Se agentes conseguem gerar afirmações científicas de projeto, artigos que descrevem essas afirmações precisam de limites e pontos de reprodução legíveis por máquina.
ARIS nomeia uma falha que se encaixa na categoria inteira: agentes de pesquisa de longa duração podem produzir sucessos plausíveis sem suporte quando o apoio em evidências permanece incompleto, mal relatado ou herdado do enquadramento do executor.7 Arquivos de afirmações dão aos agentes de pesquisa menos espaço para herdar enquadramentos sem suporte apenas da prosa.
O padrão é consistente. Agentes de pesquisa sérios precisam de objetos explícitos de evidência.
O que autores podem publicar agora?
Autores não precisam de aprovação de periódicos para começar.
A primeira versão pode ficar ao lado do artigo:
{
"id": "my-paper",
"title": "My Paper Title",
"version": "0.1.0",
"status": "draft",
"repository": "https://github.com/example/my-paper",
"claims": [
{
"id": "C1",
"statement": "The method improves retrieval accuracy on benchmark X under condition Y.",
"evidence": ["figure-2", "table-1"]
}
],
"does_not_claim": [
"The method improves retrieval accuracy outside benchmark X."
],
"definitions": [
{
"id": "D1",
"term": "retrieval accuracy",
"definition": "The percentage of queries whose top-ranked result matches the labeled answer."
}
],
"reproducibility": {
"environment": "Python 3.11",
"commands": ["python scripts/reproduce_figure_2.py"]
}
}
O primeiro arquivo deve responder a cinco perguntas:
- Quais afirmações exatas os agentes podem citar?
- Quais afirmações os agentes devem se recusar a inferir?
- Quais definições precisam permanecer estáveis?
- Quais comandos reproduzem as evidências?
- Qual versão da superfície de afirmações o agente leu?
Esse mínimo dá aos agentes um ponto de partida mais seguro. Também dá aos revisores um diff concreto quando o artigo muda.
O que revisores e plataformas devem verificar?
Revisores não devem carimbar automaticamente um arquivo JSON válido.
Eles devem comparar o arquivo com o artigo.
| Verificação | Falha |
|---|---|
| Paridade de afirmações | O arquivo de afirmações afirma mais do que o artigo prova. |
| Paridade de escopo | Uma limitação importante aparece na prosa, mas não em does_not_claim[]. |
| Paridade de definições | A definição em JSON entra em conflito com a redação do autor. |
| Paridade de comandos | O comando não reproduz mais o artefato nomeado. |
| Paridade de versão | O PDF mudou, mas o arquivo de afirmações ficou desatualizado. |
| Paridade de IDs | O artigo menciona C1 ou D1 que JSON não contém, ou JSON declara IDs órfãos. |
Plataformas podem automatizar parte desse trabalho.
Elas podem verificar sintaxe de JSON, campos obrigatórios, formato de IDs, IDs duplicados, referências ausentes, acessibilidade de URLs, presença de comandos e metadados de versão. Também podem pedir que um agente compare o arquivo de afirmações com a prosa e produza um pacote de revisão para humanos.
A revisão humana ainda decide o significado. A automação apenas torna o desvio visível.
O que o padrão deve recusar?
Arquivos de afirmações legíveis por agentes devem ser pequenos o bastante para serem adotados e rígidos o bastante para importar.
Recuse três tentações.
Primeiro, recuse dependência de plataforma. Um arquivo ao lado do PDF vale mais do que uma nova plataforma que nenhum autor adota. O rascunho de Canedo argumenta que a conformidade mínima viável deve exigir um único arquivo JSON escrito manualmente, não novas ferramentas nem registro em plataforma.1
Segundo, recuse falsa certeza. Um schema pode validar formato. Ele não consegue provar verdade semântica. Arquivos de afirmações devem dizer o que provam, o que não provam e como revisores podem verificar desvios.
Terceiro, recuse estratégia oculta. Agentes precisam de identificadores de evidência, não de prompts privados dos autores. Um arquivo público de afirmações deve expor afirmações, definições, limites e comandos. Ele não deve expor notas privadas de revisão por pares, rubricas de avaliação ocultas, credenciais ou caminhos de dados ainda não publicados.
Bons padrões reduzem ambiguidade sem exigir confiança em mecanismos secretos.
O padrão digno
O artigo digno não apenas persuade um leitor humano. Ele dá a futuros leitores, agentes, revisores e construtores um jeito de reutilizar o trabalho sem esticá-lo.
Um arquivo de afirmações legível por agentes deve tornar o artigo mais confiável ao tornar seus limites mais fáceis de inspecionar.
O padrão é simples:
- Dê um endereço a cada afirmação importante.
- Dê um campo a cada limite de escopo.
- Dê um ID estável a cada definição-chave.
- Dê um comando exato a cada figura reproduzida.
- Dê a cada agente um motivo para citar o artigo com precisão.
Agentes de pesquisa continuarão lendo artigos. Autores podem deixá-los raspar a prosa, ou podem oferecer uma superfície construída para evidências.
O segundo caminho cria citações melhores, resumos mais seguros e menos afirmações plausíveis sem âncora confiável.
Resumo rápido
Artigos científicos precisam de arquivos de afirmações legíveis por agentes porque agentes já resumem, citam, testam e reutilizam trabalhos acadêmicos. A prosa sozinha dá espaço demais para agentes citarem artigos inteiros em vez de subafirmações, exagerarem escopo, inventarem comandos ou se desviarem em definições.
paper.json oferece um ponto de partida prático: IDs estáveis de afirmações, exclusões explícitas de escopo, comandos por figura, adoção mínima viável por meio de um único arquivo JSON e IDs estáveis de definições.1 Seu repositório de exemplo adiciona validação por schema, um resolvedor e um arquivo de exemplo concreto.2
A melhor primeira versão é pequena: afirmações, o que o artigo não afirma, definições, comandos de reprodução, metadados de versão e um link de repositório. O arquivo não deve substituir o artigo. Ele deve tornar o artigo mais seguro para agentes lerem.
Perguntas frequentes
O que é um arquivo de afirmações legível por agentes?
Um arquivo de afirmações legível por agentes é um arquivo estruturado ao lado de um artigo que expõe afirmações, limites de escopo, definições, comandos de reprodução e metadados relacionados em um formato que agentes conseguem recuperar e citar.
O paper.json substitui o PDF?
Não. O PDF continua sendo o artigo legível por humanos. O arquivo de afirmações dá aos agentes uma superfície de evidências endereçável para que eles possam citar e testar afirmações do artigo com mais segurança.
Qual problema o paper.json tenta resolver?
paper.json mira falhas recorrentes de leitura por agentes: citações da subafirmação errada, extrapolação de escopo, comandos de figuras escondidos e definições instáveis.1
Um schema aprovado prova que o arquivo de afirmações está correto?
Não. Um schema pode validar campos obrigatórios, IDs e estrutura. Revisão humana ou de agentes especializados ainda precisa verificar se o arquivo de afirmações representa o artigo com fidelidade.
O que autores devem incluir primeiro?
Autores devem começar com IDs estáveis de afirmações, uma seção does_not_claim[], definições estáveis, comandos exatos de reprodução, uma URL de repositório e uma versão para o arquivo de afirmações.
Referências
-
Arquimedes Canedo, “paper.json: A Coordination Convention for LLM-Agent-Actionable Papers,” arXiv:2605.16194v1, submetido em 15 de maio de 2026. Fonte para a proposta complementar JSON, IDs estáveis de afirmações, lista explícita do que não se afirma, comandos de shell por figura, declaração de conformidade mínima viável, IDs estáveis de definições e ressalva de que as afirmações continuam sendo hipóteses em aberto. ↩↩↩↩↩↩↩↩
-
Arquimedes Canedo, “paper-json,” repositório GitHub, acessado em 18 de maio de 2026. Fonte para arquivos do repositório, incluindo
paper.json,schema.json,validator.py,resolve.py,paper.pdf,paper.typ, o exemplo funcional, campos exigidos pelo schema, limites de validação, comandos de reprodução e comportamento do resolvedor de fragmentos. ↩↩↩↩↩↩↩↩↩↩↩ -
Zhen Zhang, Liangcai Su, Zhuo Chen, Xiang Lin, Haotian Xu, Simon Shaolei Du, Kaiyu Yang, Bo An, Lidong Bing e Xinyu Wang, “Argus: Evidence Assembly for Scalable Deep Research Agents,” arXiv:2605.16217v1, submetido em 15 de maio de 2026. Fonte para papéis de Searcher/Navigator, grafo compartilhado de evidências, despacho de evidências ausentes e enquadramento de montagem de evidências para agentes de pesquisa profunda. ↩↩
-
Noga Peleg Pelc, Gal A. Kaminka e Yoav Goldberg, “A Language for Describing Agentic LLM Contexts,” arXiv:2605.01920v1, submetido em 3 de maio de 2026. Fonte para ACDL, a necessidade de descrever composição e dinâmica de contexto de agentes, e a crítica de que prosa informal, diagramas ad hoc e inspeção de código são insuficientes como descrições de contexto. ↩↩
-
Ziang Ye, Wentao Shi, Yuxin Liu, Yu Wang, Zhengzhou Cai, Yaorui Shi, Qi Gu, Xunliang Cai e Fuli Feng, “Look Before You Leap: Autonomous Exploration for LLM Agents,” arXiv:2605.16143v1, submetido em 15 de maio de 2026. Fonte para exploração prematura, Exploration Checkpoint Coverage e o paradigma Explore-then-Act. ↩↩
-
Alberto Pepe, Chien-Yu Lin, Despoina Magka, Bilge Acun, Yannan Nellie Wu, Anton Protopopov, Carole-Jean Wu e Yoram Bachrach, “Agentic Discovery of Neural Architectures: AIRA-Compose and AIRA-Design,” arXiv:2605.15871v1, submetido em 15 de maio de 2026. Fonte para descoberta multiagente de arquiteturas neurais, exploração de 24 horas, famílias de arquiteturas relatadas e afirmações de precisão/escalabilidade posteriores. ↩↩
-
Ruofeng Yang, Yongcan Li e Shuai Li, “ARIS: Autonomous Research via Adversarial Multi-Agent Collaboration,” arXiv:2605.03042v1, submetido em 4 de maio de 2026. Fonte para o modo de falha de sucesso plausível sem suporte em agentes de pesquisa de longa duração e a necessidade de revisão adversarial de artefatos intermediários de pesquisa. ↩