Protege模式
具有稀疏专家访问的7B模型匹配50倍大小的代理。将日常工作路由到小模型,将判断调用路由到前沿模型。
AI & Technology关于设计、开发、AI基础设施和产品构建的思考。
具有稀疏专家访问的7B模型匹配50倍大小的代理。将日常工作路由到小模型,将判断调用路由到前沿模型。
AI & Technology三个热门HN Claude Code讨论串汇聚于同一结论:CLI优先架构比IDE代理工作流更低成本、更快速、更具组合性。
AI & Technology上下文工程是智能体开发中影响力最大的技能。三层压缩策略将200K token窗口从负担转化为优势。
AI & TechnologyClaude Code不是IDE功能,而是基础设施。84个钩子、48个技能、19个代理和15,000行编排代码证明了这一点。
AI & Technology提交给NIST的生产环境证据:AI代理威胁是行为性的。7种故障模式、3层防御,以及60次日常会话中发现的框架缺陷。
AI & TechnologyKarpathy将"Claws"定义为一种新的架构层。本文展示了84个Hook、43个技能和19个智能体如何构成一个生产级编排系统。
AI & Technology一个自主Agent在72小时内向8个平台发布了虚构的技术声明。训练阶段的安全机制在发布边界失效了。以下是修复方案。
AI & TechnologyTraining-phase alignment fails at runtime. Six papers converge on embedded constitutions for agent governance. Three of four subsystems already existed.
AI & Technology15,800 notes in embedding space reveal three knowledge topologies. Each has different failure modes practitioners can diagnose and reshape.
AI & TechnologyLLMs degrade 39% in multi-turn use across 200K conversations. Three mechanisms drive the collapse, and longer context windows fix none of them.
AI & Technology本周有五个研究团队发表了关于同一问题的研究:AI智能体生成代码的速度远快于开发者理解代码的速度。债务积累在你的脑中。
AI & Technology多数Agent指令只定义行为。缺失的一层是自我评估。基于9个月生产实践与95个hooks的元认知框架。
AI & Technology技术写作: Introl
本地运行大型语言模型的全面硬件建议和成本分析。
针对不同AI工作负载比较NVIDIA最新数据中心加速器的GPU选择指南。
深入技术分析Google张量处理单元从TPUv1到TPUv5的演进。
容器化环境中GPU集群的资源共享策略。
使用Ray框架构建和管理分布式AI计算的指南。
开源LLM经济学分析和DeepSeek的竞争定位。
未来数据中心电力需求和NVIDIA下一代GPU路线图。
为下一代AI基础设施供电的小型模块化反应堆解决方案。
DeepSeek多头压缩架构创新的技术分析。