10%之牆:AI生產力為何停滯不前
121,000名開發者受訪,92.6%使用AI工具,生產力卻卡在10%。問題在基礎設施,而非智能。三個根本原因與對策。
AI Engineering關於設計、開發、AI基礎設施和產品構建的思考。
121,000名開發者受訪,92.6%使用AI工具,生產力卻卡在10%。問題在基礎設施,而非智能。三個根本原因與對策。
AI Engineering提交給NIST的生產環境證據:AI代理威脅是行為性的。7種故障模式、3層防禦,以及60次日常會話中發現的框架缺陷。
AI & TechnologyKarpathy將「Claws」定義為一種新的架構層。以下是84個hook、43個skill與19個agent作為生產級編排系統的實際樣貌。
AI & Technology一個自主代理程式在72小時內將捏造的聲明發布到8個平台。訓練階段的安全措施在發布邊界失效。以下是修復方案。
AI & TechnologyTraining-phase alignment fails at runtime. Six papers converge on embedded constitutions for agent governance. Three of four subsystems already existed.
AI & Technology15,800 notes in embedding space reveal three knowledge topologies. Each has different failure modes practitioners can diagnose and reshape.
AI & TechnologyLLMs degrade 39% in multi-turn use across 200K conversations. Three mechanisms drive the collapse, and longer context windows fix none of them.
AI & Technology本週有五個研究團隊發表了關於同一個問題的論文:AI 代理產生程式碼的速度遠超開發者理解它的速度。債務累積在你的腦中。
AI & Technology用預設與即時控制快速建立 GLSL 直覺的實作型實驗室,基於零框架 WebGL。
Interactive Explorations多數代理程式指令只定義行為。缺失層是自我評估。基於九個月生產使用與95個hooks的後設認知框架。
AI & Technology一個733行的Python管線,從四個維度為筆記評分,並將7,700多個項目進行確定性路由。演算法、權重,以及誠實的結果。
Engineering PracticeCraig Reynolds 的 boids 演算法展示了三個局部規則如何產生全域協同。相同的原理與失效模式也出現在多智能體 AI 系統中。
Interactive Explorations技術寫作: Introl
本地運行大型語言模型的全面硬體建議和成本分析。
針對不同AI工作負載比較NVIDIA最新資料中心加速器的GPU選擇指南。
深入技術分析Google張量處理單元從TPUv1到TPUv5的演進。
容器化環境中GPU叢集的資源共享策略。
使用Ray框架構建和管理分散式AI運算的指南。
開源LLM經濟學分析和DeepSeek的競爭定位。
未來資料中心電力需求和NVIDIA下一代GPU路線圖。
為下一代AI基礎設施供電的小型模組化反應爐解決方案。
DeepSeek多頭壓縮架構創新的技術分析。