Contexto compuesto: por qué los proyectos con IA mejoran cuanto más tiempo les dedicas

11 min de lectura

Hace seis meses, una tarea de programación en mi proyecto resumegeni requería toda una sesión de explicación. El agente necesitaba entender el esquema de base de datos, las convenciones de rutas, la herencia de plantillas, la capa de caché, el pipeline de despliegue y los patrones de pruebas antes de poder tocar una sola línea de código. Cada sesión empezaba desde cero.

La semana pasada, dije “arregla el rendimiento de la página de mercado” y el agente leyó un documento de traspaso de una sesión anterior, identificó el cuello de botella en market_hub(), implementó una consulta paginada a la base de datos con un RPC agregado, escribió pruebas y desplegó. Austin pasó de 14 segundos a 108 milisegundos. El agente no se volvió más inteligente. El proyecto se volvió más rico.

La diferencia no es el modelo. La diferencia es el contexto acumulado que rodea al proyecto: el CLAUDE.md que describe convenciones, los archivos de memoria que capturan decisiones, los documentos de traspaso que preservan diagnósticos entre sesiones, los hooks que imponen restricciones, los skills que codifican flujos de trabajo, los conjuntos de pruebas que verifican la corrección, los registros de capitanía que documentan qué se desplegó y por qué. Cada artefacto fue creado para resolver un problema específico. Juntos, hacen que cada problema subsiguiente sea más barato de resolver.

Esto es contexto compuesto.

Resumen

Contexto compuesto es el fenómeno por el cual los proyectos asistidos por IA mejoran más rápido cuanto más tiempo trabajas en ellos, porque los problemas resueltos depositan contexto reutilizable que reduce el costo de resolver el siguiente problema.
El modelo no mejora entre sesiones. La infraestructura del proyecto sí: archivos CLAUDE.md, sistemas de memoria, hooks, skills, documentos de traspaso, cobertura de pruebas, convenciones de nombres y registros operacionales.
El contexto compuesto explica por qué iniciar un proyecto nuevo con un agente de IA se siente lento, pero la sesión número 500 en el mismo proyecto se siente rápida. La primera sesión construye contexto. La sesión 500 lo gasta.
El efecto no es automático. Requiere inversión intencional en artefactos de contexto: documentos que capturan decisiones, hooks que codifican restricciones, pruebas que verifican suposiciones y registros que preservan la historia operacional.
Las organizaciones que entienden el contexto compuesto dejarán de rotar ingenieros entre proyectos cada trimestre y comenzarán a tratar el contexto acumulado del proyecto como un activo de capital.

Qué se acumula

El contexto compuesto opera a través de seis categorías de conocimiento acumulado del proyecto. Cada categoría deposita un tipo diferente de retorno.

Documentos de convenciones (CLAUDE.md). Un archivo CLAUDE.md le indica a cada sesión de agente cómo funciona el proyecto: estructura de archivos, convenciones de nombres, patrones de importación, enfoque de pruebas, proceso de despliegue. La primera sesión sin un CLAUDE.md dedica gran parte de su esfuerzo a descubrir convenciones. La centésima sesión con un CLAUDE.md maduro no dedica nada. El documento se acumula porque cada convención capturada una vez nunca necesita ser re-explicada.

Memoria de decisiones. Los archivos de memoria capturan por qué se tomaron las decisiones, no solo qué se decidió. Cuando una sesión futura encuentra la misma disyuntiva, lee la memoria en lugar de volver a derivar la respuesta. Mi sistema de memoria almacena decisiones de proyecto, preferencias del usuario, correcciones de retroalimentación y punteros de referencia. Cada memoria es pequeña. La colección es una caché de decisiones que evita que el proyecto vuelva a litigar cuestiones ya resueltas.

Documentos de traspaso. Un documento de traspaso preserva un diagnóstico a través de los límites entre sesiones. El traspaso del rendimiento de la página de mercado sobrevivió tres correcciones de revisión de código, dos reordenamientos de prioridad y, en última instancia, guió la implementación cuatro días después. Sin el traspaso, la siguiente sesión habría comenzado la investigación desde cero, probablemente apuntando a la ruta de código equivocada (como lo hizo el primer borrador). El traspaso se acumuló al convertir tiempo de diagnóstico en un artefacto reutilizable.

Hooks y restricciones. Cada hook codifica una lección de un fallo pasado. Mi guardia destructiva de API existe porque un agente purgó toda la caché de Cloudflare. Mi hook de sandbox existe porque un agente intentó escribir en ~/.ssh/. Mi detector de desvíos existe porque los agentes perdieron el rastro de su tarea doce veces en sesenta días. Cada hook previene que la misma clase de fallo se repita en todas las sesiones futuras. Los hooks se acumulan porque convierten la respuesta a incidentes en prevención permanente.

Skills y flujos de trabajo. Un skill es un flujo de trabajo codificado que un agente puede ejecutar sin reinventar el proceso. Mi skill /nightcheck ejecuta más de 50 verificaciones de páginas con benchmarks de TTFB, verificación de caché y rastreos exhaustivos del sitemap. Mi skill /scan-intel busca en seis fuentes académicas a través de ocho temas de investigación con deduplicación y puntuación. Mi skill /blog-translator traduce publicaciones a nueve idiomas con preservación de formato. Cada skill fue costoso de construir una vez y es gratuito de ejecutar para siempre. Los skills se acumulan porque convierten conocimiento de procesos en automatización ejecutable.

Conjuntos de pruebas. Las pruebas verifican que el proyecto sigue funcionando después de los cambios. Un conjunto de pruebas maduro permite que un agente haga cambios agresivos con confianza, porque los fallos se detectan inmediatamente. Un proyecto sin pruebas obliga a cambios conservadores e incrementales porque el agente no puede verificar su trabajo. La cobertura de pruebas se acumula porque cada prueba hace que los cambios futuros sean más baratos y seguros.

La curva de acumulación

El contexto compuesto sigue una curva característica.

Sesiones 1-10: Fase de inversión. La mayor parte del esfuerzo se destina a construir contexto en lugar de entregar funcionalidades. Escribes el CLAUDE.md, estableces convenciones, creas los primeros hooks, configuras el framework de pruebas. La producción se siente lenta porque estás construyendo infraestructura, no producto.

Sesiones 10-50: Fase de aceleración. El contexto comienza a generar valor. El agente deja de preguntar sobre convenciones y empieza a seguirlas. Los hooks detectan errores antes de que se desplieguen. Los skills automatizan flujos de trabajo repetitivos. Cada sesión produce más resultados que la anterior porque la base de contexto está creciendo.

Sesiones 50-200: Fase de acumulación. El proyecto tiene suficiente contexto acumulado para que los problemas difíciles se vuelvan fáciles. Un agente que lee un CLAUDE.md maduro, un conjunto de archivos de memoria y un documento de traspaso puede ejecutar implementaciones complejas de múltiples pasos sin orientación adicional. La corrección de la página de mercado ocurrió en esta fase. Una sola oración (“arregla el rendimiento de la página de mercado”) desencadenó un proceso de cuatro días que terminó con una mejora de 132x porque la infraestructura de contexto llevaba el diagnóstico, las restricciones y los criterios de verificación.

Sesiones 200+: Fase de mantenimiento. La tasa de creación de contexto nuevo se desacelera porque la mayoría de las convenciones, restricciones y flujos de trabajo ya están capturados. El enfoque se desplaza hacia actualizar el contexto existente (corregir memorias desactualizadas, extender skills, agregar pruebas para nuevos casos extremos) en lugar de crearlo desde cero. El efecto de acumulación se estabiliza pero se mantiene alto.

Por qué esto no es obvio

Tres factores oscurecen el efecto de acumulación.

Las mejoras del modelo enmascaran las mejoras del contexto. Cuando tus sesiones de IA mejoran con el tiempo, atribuyes la mejora a mejores modelos. Claude Opus 4.6 es mejor que Claude 3.5 Sonnet. Pero la mejora que experimentas en un proyecto de larga duración supera la mejora del modelo porque el contexto compuesto se apila sobre la mejora del modelo. Cambiar a un proyecto nuevo con el mismo modelo revela la diferencia: el nuevo proyecto se siente lento porque no tiene contexto compuesto.

El contexto es invisible. Un archivo CLAUDE.md es un documento de texto. Los archivos de memoria son notas en markdown. Los hooks son scripts de shell. Ninguno de estos artefactos se ve impresionante individualmente. El efecto de acumulación no es visible en ningún artefacto individual. Solo es visible en el comportamiento agregado de las sesiones que operan contra la pila completa de contexto. No puedes señalar un solo archivo y decir “por esto el proyecto es rápido”. Solo puedes comparar la sesión 500 con la primera y notar la diferencia.

Iniciar proyectos nuevos se siente emocionante. Un proyecto nuevo tiene energía fresca y ninguna deuda acumulada. Pero tampoco tiene contexto acumulado. La primera sesión en un proyecto nuevo se siente productiva porque toma decisiones de alto nivel que se sienten impactantes. La sesión 20 en un proyecto existente se siente rutinaria porque ejecuta dentro de convenciones establecidas. La sensación de rutina es el efecto de acumulación funcionando. La sensación de emoción es su ausencia.

Qué impide la acumulación

Cuatro modos de fallo rompen la curva de acumulación.

Deterioro del contexto. Memorias desactualizadas, secciones obsoletas del CLAUDE.md y hooks deprecados crean confusión en lugar de claridad. Un agente que sigue convenciones desactualizadas produce peores resultados que un agente sin convenciones. El contexto requiere mantenimiento. Mi sistema de memoria incluye marcas de tiempo de última actualización y verificaciones explícitas de obsolescencia. El contexto muerto es peor que la ausencia de contexto.

Dispersión del contexto. Demasiados archivos, demasiados hooks, demasiados skills crean un problema de descubrimiento. Si el agente no puede encontrar el contexto relevante, el contexto no se acumula. La organización importa: mis archivos de memoria usan frontmatter con descripciones para que las sesiones futuras puedan evaluar la relevancia sin leer el contenido completo. Mis hooks están registrados en un dispatcher que los carga por tipo de evento. El contexto descubrible se acumula. El contexto enterrado se deteriora.

Aislamiento de sesiones. Si las sesiones no leen ni escriben contexto persistente, cada sesión empieza desde cero. El efecto de acumulación requiere puentes intencionales: documentos de traspaso que llevan diagnósticos entre sesiones, escrituras de memoria que capturan decisiones, registros de capitanía que documentan la historia operacional. Sin estos puentes, un proyecto con 500 sesiones tiene el mismo contexto efectivo que un proyecto con una.

Rotación de plataformas. Cambiar entre herramientas de IA reinicia la pila de contexto. Un CLAUDE.md escrito para una plataforma no ayuda automáticamente a otra. Los hooks escritos para el modelo de eventos de una plataforma no se disparan en otra. El contexto compuesto es específico de la plataforma, lo que crea un lock-in que también es un foso competitivo. Cuanto más profunda sea tu pila de contexto en una plataforma, mayor será el costo de cambio y más rápido mejorará tu proyecto en relación con competidores que siguen cambiando.

El contexto compuesto como capital

En finanzas, el interés compuesto convierte depósitos pequeños en grandes sumas dado el tiempo suficiente. La idea clave es que los retornos mismos generan más retornos. El contexto compuesto funciona de la misma manera.

Una convención capturada en CLAUDE.md reduce la re-explicación en cada sesión futura. Ese tiempo ahorrado se dedica a resolver nuevos problemas, lo que genera nuevas convenciones, que a su vez reducen aún más la re-explicación futura. Un hook que previene una clase de fallo elimina la re-investigación de ese fallo en cada sesión futura. Ese tiempo ahorrado se dedica a construir nuevos hooks para nuevas clases de fallos. Cada inversión genera retornos que permiten más inversión.

La implicación para las organizaciones: el contexto del proyecto es un activo de capital. Rotar ingenieros entre proyectos cada trimestre destruye el contexto acumulado de la misma manera que cerrar una cuenta de ahorros destruye el interés acumulado. Un equipo que permanece en el mismo proyecto durante dos años con asistencia de IA superará a un equipo que rota trimestralmente, no porque los individuos sean mejores, sino porque el contexto se ha acumulado.

La implicación para ingenieros individuales: tu infraestructura de IA es un portafolio de inversión. Cada sección de CLAUDE.md, cada archivo de memoria, cada hook, cada skill, cada documento de traspaso es un depósito. El portafolio crece lentamente al principio. Después de cientos de sesiones, genera retornos que hacen que los problemas difíciles parezcan fáciles para observadores que no ven la pila de contexto debajo.

La página de mercado pasó de 14 segundos a 108 milisegundos. Un observador ve una corrección de rendimiento. Yo veo un documento de traspaso que sobrevivió tres revisiones, un sistema de nightcheck que midió la regresión, una guardia destructiva que previno una repetición de la purga de caché, un skill de revisión de código que detectó el objetivo inicial equivocado y quinientas sesiones de contexto acumulado que hicieron todo posible.

Eso es contexto compuesto.

FAQ

¿Qué es el contexto compuesto?

El contexto compuesto es el fenómeno por el cual los proyectos asistidos por IA mejoran más rápido con el tiempo porque los problemas resueltos depositan contexto reutilizable (documentos, hooks, skills, pruebas, memorias) que reduce el costo de resolver problemas subsiguientes. El término es análogo al interés compuesto: los retornos mismos generan más retornos.

¿Funciona con cualquier herramienta de IA?

El principio se aplica de manera amplia, pero la implementación depende del soporte de la herramienta para contexto persistente. Claude Code soporta archivos CLAUDE.md, hooks, skills y sistemas de memoria de forma nativa. Otras herramientas pueden requerir andamiaje externo para lograr el mismo efecto. La curva de acumulación es más pronunciada en plataformas que proporcionan más mecanismos de persistencia de contexto.

¿Cómo empiezo a construir contexto compuesto?

Comienza con un CLAUDE.md que describa las convenciones de tu proyecto. Agrega archivos de memoria para decisiones clave. Escribe hooks para patrones de fallo que hayas experimentado. Crea skills para flujos de trabajo que repites entre sesiones. La inversión se siente lenta inicialmente. Los retornos aparecen después de 10-20 sesiones.

¿Esto es simplemente documentación?

No. La documentación es un componente, pero el contexto compuesto también incluye artefactos ejecutables: hooks que imponen restricciones en tiempo de ejecución, skills que automatizan flujos de trabajo, conjuntos de pruebas que verifican la corrección y sistemas de memoria que informan la toma de decisiones. La documentación estática explica. El contexto compuesto actúa.

¿Qué pasa con los límites de la ventana de contexto?

El contexto compuesto no requiere cargar todo el contexto en cada sesión. Requiere que el contexto adecuado esté disponible cuando se necesita. Un CLAUDE.md se carga automáticamente. Los archivos de memoria se consultan por relevancia. Los documentos de traspaso se leen al continuar una tarea específica. La pila de contexto es más grande que cualquier ventana de contexto individual. El agente accede al segmento relevante por sesión.

¿Cómo sé si mi proyecto tiene contexto compuesto?

Compara el esfuerzo requerido para tareas similares al inicio versus al final de la historia del proyecto. Si una tarea que tomó una sesión completa en el mes uno se resuelve con un solo prompt en el mes seis, el contexto compuesto está funcionando. Si el esfuerzo es el mismo, el contexto no se está acumulando o no se está persistiendo entre sesiones.

Fuentes

Este artículo se basa en experiencia de producción de más de 500 sesiones de programación autónoma en seis proyectos desde mayo de 2025. Ejemplos específicos referenciados:

Rendimiento de la página de mercado: documento de traspaso, verificación de nightcheck y despliegue descritos en los registros de capitanía del 21 al 25 de marzo de 2026
Guardias destructivas de API: construidas después de que un agente purgó toda la caché de Cloudflare, descritas en la publicación deploy-and-defend
Infraestructura de hooks y skills: 84 hooks interceptando 15 tipos de eventos, descritos en el comentario NIST
Detección de desvíos: seguimiento de similitud coseno en más de 60 sesiones, descrito en The Invisible Agent
Bucles de autoresearch: experimentos con presupuesto fijo en Apple Silicon, validados por el artículo Claudini
Documentación de Anthropic sobre memoria e instrucciones de proyecto de Claude Code: Manage Claude’s memory
Repositorio autoresearch de Andrej Karpathy: autoresearch