AI Agent 记忆退化:为何多轮LLM会崩溃
LLM在超过200K次多轮会话中准确率下降39%。三种机制驱动了这一崩溃,而更长的上下文窗口无法解决其中任何一个。
AI & Technology关于设计、开发、AI基础设施和产品构建的思考。
LLM在超过200K次多轮会话中准确率下降39%。三种机制驱动了这一崩溃,而更长的上下文窗口无法解决其中任何一个。
AI & Technology运行时宪法在训练阶段对齐失效之处强制执行AI智能体治理。能力检查、输出门控与四大子系统共同保障智能体安全。
AI & Technology本周有五个研究团队发表了关于同一问题的研究:AI智能体生成代码的速度远快于开发者理解代码的速度。债务积累在你的脑中。
AI & Technology多数Agent指令只定义行为。缺失的一层是自我评估。基于9个月生产实践与95个hooks的元认知框架。
AI & Technology横跨650个文件、七层层级结构的AI代理上下文工程。三次生产故障、真实的token预算,以及在这些考验中存活下来的系统。
AI & Technology多智能体协商能捕获单智能体系统遗漏的失败。这里记录了架构设计、走过的弯路,以及真正值得构建的部分。
AI & Technology我的Claude Code智能体以机器速度继承了人类所有的马虎习惯。我构建了3套哲学、150多道质量关卡和95个钩子。以下是真正奏效的部分。
AI & TechnologyXcodeBuildMCP与Apple的Xcode MCP为Claude Code提供对iOS构建、测试与调试的结构化访问。配置方法、实际效果与诚实的经验总结。
AI & TechnologyMcKinsey发现90%的公司声称采用了AI,但只有23%能够超越试点阶段实现规模化。我亲眼见证了三种AI表演形式,并且自己也曾实践过其中一种。
AI & Technology我构建了一个3,500行代码的智能体系统,包含86个钩子和共识验证机制。以下是我在RAG、微调和智能体编排方面的经验总结。
AI & Technology大多数代码库越大越慢,我的却在加速。95个钩子、44个技能和14个配置让每个新功能的成本持续降低。
AI & Technology五次提示词失败教会我:结构化观察胜过巧妙措辞。Boyd的OODA循环直接映射到我的日常提示词工程工作流。
AI & Technology技术写作: Introl
本地运行大型语言模型的全面硬件建议和成本分析。
针对不同AI工作负载比较NVIDIA最新数据中心加速器的GPU选择指南。
深入技术分析Google张量处理单元从TPUv1到TPUv5的演进。
容器化环境中GPU集群的资源共享策略。
使用Ray框架构建和管理分布式AI计算的指南。
开源LLM经济学分析和DeepSeek的竞争定位。
未来数据中心电力需求和NVIDIA下一代GPU路线图。
为下一代AI基础设施供电的小型模块化反应堆解决方案。
DeepSeek多头压缩架构创新的技术分析。