隐形代理:为什么看不见的东西无法治理
Anthropic悄悄在用户的Mac上放置了一个10GB的虚拟机。代理可观测性需要三个层级:资源计量、策略执行和运行时审计。
AI & Technology关于设计、开发、AI基础设施和产品构建的思考。
Anthropic悄悄在用户的Mac上放置了一个10GB的虚拟机。代理可观测性需要三个层级:资源计量、策略执行和运行时审计。
AI & TechnologyGit记录了什么发生了变化。智能体会话记录了为什么。当智能体编写代码时,会话记录才是真正的设计文档——而我们却将其丢弃。
AI & Technology一个恶意网页将指令注入了URL元数据中。代理获取了该页面,读取了投毒内容,并将API密钥外泄。没有报错,没有日志。
AI & Technology49,746个文本块,83 MB,零API调用。BM25 + 向量搜索 + RRF融合如何在一个SQLite文件中将16,894个Obsidian文件转变为可查询的知识库。
AI Engineering哪些 AGENTS.md 模式真正改变了智能体行为?应避免的反模式、有效的模式,以及覆盖8种工具的跨工具兼容性矩阵。
AI Development从零构建代码审查技能。涵盖目录结构、frontmatter字段、基于LLM的匹配、上下文预算和自动激活。
AI Development两个Claude Code PR中118个函数出现3倍至446倍的性能下降。AI代理优化的是正确性,而非性能。关于原因的数据,以及应该构建什么。
AI Engineering三个热门HN Claude Code讨论串汇聚于同一结论:CLI优先架构比IDE代理工作流更低成本、更快速、更具组合性。
AI & Technology来自500多次自主智能体会话的七种命名失败模式。每种模式都有检测信号、真实案例和具体修复方案。HN社区期待的分类体系。
AI EngineeringAnthropic分析了9,830次对话。迭代优化使流畅度指标翻倍。精美的输出抑制了评估行为。质量钩子强制执行迭代流程。
AI Engineering具有稀疏专家访问的7B模型匹配50倍大小的代理。将日常工作路由到小模型,将判断调用路由到前沿模型。
AI & Technology上下文工程是智能体开发中影响力最大的技能。三层压缩策略将200K token窗口从负担转化为优势。
AI & Technology技术写作: Introl
本地运行大型语言模型的全面硬件建议和成本分析。
针对不同AI工作负载比较NVIDIA最新数据中心加速器的GPU选择指南。
深入技术分析Google张量处理单元从TPUv1到TPUv5的演进。
容器化环境中GPU集群的资源共享策略。
使用Ray框架构建和管理分布式AI计算的指南。
开源LLM经济学分析和DeepSeek的竞争定位。
未来数据中心电力需求和NVIDIA下一代GPU路线图。
为下一代AI基础设施供电的小型模块化反应堆解决方案。
DeepSeek多头压缩架构创新的技术分析。