我向 NIST 提交的 AI 代理安全意見
提交給NIST的生產環境證據:AI代理威脅是行為性的。7種故障模式、3層防禦,以及60次日常會話中發現的框架缺陷。
AI & Technology關於設計、開發、AI基礎設施和產品構建的思考。
提交給NIST的生產環境證據:AI代理威脅是行為性的。7種故障模式、3層防禦,以及60次日常會話中發現的框架缺陷。
AI & Technology121,000名開發者受訪,92.6%使用AI工具,生產力卻卡在10%。問題在基礎設施,而非智能。三個根本原因與對策。
AI Engineering一個自主代理程式在72小時內將捏造的聲明發布到8個平台。訓練階段的安全措施在發布邊界失效。以下是修復方案。
AI & TechnologyKarpathy將「Claws」定義為一種新的架構層。以下是84個hook、43個skill與19個agent作為生產級編排系統的實際樣貌。
AI & Technology執行期憲法在訓練階段對齊失效之處強制執行 AI 代理治理。能力檢查、輸出閘門與四大子系統確保代理安全運作。
AI & TechnologyLLM在超過200K次多輪對話中準確率下降39%。三種機制導致崩潰,而更長的上下文視窗無法解決任何一種。
AI & Technology將 15,800 篇 Obsidian 筆記投射至嵌入空間,揭示三種知識拓撲結構。每種都有可診斷的失效模式,並可透過橋接筆記加以重塑。
AI & Technology本週有五個研究團隊發表了關於同一個問題的論文:AI 代理產生程式碼的速度遠超開發者理解它的速度。債務累積在你的腦中。
AI & Technology用預設與即時控制快速建立 GLSL 直覺的實作型實驗室,基於零框架 WebGL。
Interactive Explorations一個733行的Python管線,從四個維度為筆記評分,並將7,700多個項目進行確定性路由。演算法、權重,以及誠實的結果。
Engineering PracticeCraig Reynolds 的 boids 演算法展示了三個局部規則如何產生全域協同。相同的原理與失效模式也出現在多智能體 AI 系統中。
Interactive Explorations橫跨650個檔案、七層階層架構的AI代理Context Engineering。三次生產環境失敗、真實的token預算,以及最終存活下來的系統。
AI & Technology技術寫作: Introl
本地運行大型語言模型的全面硬體建議和成本分析。
針對不同AI工作負載比較NVIDIA最新資料中心加速器的GPU選擇指南。
深入技術分析Google張量處理單元從TPUv1到TPUv5的演進。
容器化環境中GPU叢集的資源共享策略。
使用Ray框架構建和管理分散式AI運算的指南。
開源LLM經濟學分析和DeepSeek的競爭定位。
未來資料中心電力需求和NVIDIA下一代GPU路線圖。
為下一代AI基礎設施供電的小型模組化反應爐解決方案。
DeepSeek多頭壓縮架構創新的技術分析。