效能盲點:AI 代理寫出緩慢的程式碼
兩個 Claude Code PR 中的 118 個函式,效能降低幅度從 3 倍到 446 倍。AI 代理追求正確性,而非效能。數據解析其原因,以及該如何應對。
AI Engineering關於設計、開發、AI基礎設施和產品構建的思考。
兩個 Claude Code PR 中的 118 個函式,效能降低幅度從 3 倍到 446 倍。AI 代理追求正確性,而非效能。數據解析其原因,以及該如何應對。
AI EngineeringAnthropic 分析了9,830次對話。迭代式精煉使流暢度指標提升一倍。精緻的輸出抑制了評估行為。品質 hooks 強制執行迭代。
AI Engineering具有稀疏專家存取的7B模型匹配50倍大小的代理。將日常工作路由到小模型,將判斷呼叫路由到前沿模型。
AI & Technology來自500多次自主代理會話的七種具名失敗模式。每種都有偵測信號、真實案例和具體修復方案。HN社群要求的分類學。
AI Engineering三個 HN 熱門 Claude Code 討論串匯聚出同一個結論:CLI 優先架構比 IDE 代理工作流程更便宜、更快速、更具組合性。
AI & Technology架構、安全性與擴充性的並排比較。包含基於36場盲測對決與日常生產環境使用經驗的決策框架。
AI Development情境工程是代理開發中影響力最大的技能。三層壓縮機制將200K token視窗從負擔轉變為優勢。
AI & TechnologyClaude Code不是IDE功能,而是基礎設施。84個鉤子、48個技能、19個代理程式,以及15,000行編排程式碼證明了這一點。
AI & Technology您無法透過更加努力來消除自身的認知偏誤。10個AI智能體彼此辯論,是改善決策的結構性介入方法。
AI EngineeringClaude Code對決Codex CLI,在36場對決中以5個維度進行盲審評分。勝負並非重點,真正的價值在於結合雙方代理最強構想的綜合方案。
AI Engineering提交給NIST的生產環境證據:AI代理威脅是行為性的。7種故障模式、3層防禦,以及60次日常會話中發現的框架缺陷。
AI & Technology121,000名開發者受訪,92.6%使用AI工具,生產力卻卡在10%。問題在基礎設施,而非智能。三個根本原因與對策。
AI Engineering技術寫作: Introl
本地運行大型語言模型的全面硬體建議和成本分析。
針對不同AI工作負載比較NVIDIA最新資料中心加速器的GPU選擇指南。
深入技術分析Google張量處理單元從TPUv1到TPUv5的演進。
容器化環境中GPU叢集的資源共享策略。
使用Ray框架構建和管理分散式AI運算的指南。
開源LLM經濟學分析和DeepSeek的競爭定位。
未來資料中心電力需求和NVIDIA下一代GPU路線圖。
為下一代AI基礎設施供電的小型模組化反應爐解決方案。
DeepSeek多頭壓縮架構創新的技術分析。