El Patrón Protégé
Un modelo 7B con acceso experto disperso iguala agentes 50 veces su tamano. Ruta trabajo rutinario a modelos pequenos y juicios a modelos frontier.
AI & TechnologyPensamientos sobre diseno, desarrollo, infraestructura de IA y creacion de productos.
Un modelo 7B con acceso experto disperso iguala agentes 50 veces su tamano. Ruta trabajo rutinario a modelos pequenos y juicios a modelos frontier.
AI & TechnologyTres hilos principales de HN sobre Claude Code convergen en una conclusión: la arquitectura CLI-first es más económica, más rápida y más componible que los flujos de trabajo de agentes en IDE.
AI & TechnologyLa ingeniería de contexto es la habilidad de mayor impacto en el desarrollo de agentes. Tres capas de compresión convierten una ventana de 200K tokens de un pasivo en una ventaja.
AI & TechnologyClaude Code no es una función del IDE. Es infraestructura. 84 hooks, 48 skills, 19 agentes y 15.000 líneas de orquestación lo demuestran.
AI & TechnologyEvidencia enviada al NIST: las amenazas de agentes IA son conductuales. 7 modos de fallo, defensa de 3 capas y brechas de frameworks en 60 sesiones.
AI & TechnologyKarpathy identificó las 'Claws' como una nueva capa arquitectónica. Así es como lucen 84 hooks, 43 skills y 19 agentes como sistema de orquestación en producción.
AI & TechnologyUn agente autónomo publicó afirmaciones fabricadas en 8 plataformas durante 72 horas. La seguridad de la fase de entrenamiento falló en el límite de publicación. Aquí está la solución.
AI & TechnologyTraining-phase alignment fails at runtime. Six papers converge on embedded constitutions for agent governance. Three of four subsystems already existed.
AI & Technology15,800 notes in embedding space reveal three knowledge topologies. Each has different failure modes practitioners can diagnose and reshape.
AI & TechnologyLLMs degrade 39% in multi-turn use across 200K conversations. Three mechanisms drive the collapse, and longer context windows fix none of them.
AI & TechnologyCinco grupos de investigación publicaron sobre el mismo problema esta semana: los agentes de IA producen código más rápido de lo que los desarrolladores pueden comprenderlo. La deuda está en su cabeza.
AI & TechnologyLa mayoría de instrucciones de agentes definen comportamiento. La capa faltante enseña autoevaluación: un marco metacognitivo basado en nueve meses de producción y 95 hooks.
AI & TechnologyEscritura tecnica en Introl
Recomendaciones de hardware completas y análisis de costos para ejecutar grandes modelos de lenguaje localmente.
Guía de selección de GPU comparando los últimos aceleradores de datacenter de NVIDIA para diferentes cargas de trabajo de IA.
Análisis técnico profundo de la evolución de la Tensor Processing Unit de Google desde TPUv1 hasta TPUv5.
Estrategias de compartición de recursos para clústeres GPU en entornos containerizados.
Guía para construir y gestionar computación de IA distribuida con el framework Ray.
Análisis de la economía de LLM de código abierto y el posicionamiento competitivo de DeepSeek.
Requisitos de energía futuros de centros de datos y hoja de ruta de GPU de próxima generación de NVIDIA.
Soluciones de reactores modulares pequeños para alimentar la infraestructura de IA de próxima generación.
Análisis técnico de las innovaciones de arquitectura Multi-Head Compression de DeepSeek.