Protege模式
具有稀疏專家存取的7B模型匹配50倍大小的代理。將日常工作路由到小模型,將判斷呼叫路由到前沿模型。
AI & Technology關於設計、開發、AI基礎設施和產品構建的思考。
具有稀疏專家存取的7B模型匹配50倍大小的代理。將日常工作路由到小模型,將判斷呼叫路由到前沿模型。
AI & Technology三個 HN 熱門 Claude Code 討論串匯聚出同一個結論:CLI 優先架構比 IDE 代理工作流程更便宜、更快速、更具組合性。
AI & Technology情境工程是代理開發中影響力最大的技能。三層壓縮機制將200K token視窗從負擔轉變為優勢。
AI & TechnologyClaude Code不是IDE功能,而是基礎設施。84個鉤子、48個技能、19個代理程式,以及15,000行編排程式碼證明了這一點。
AI & Technology提交給NIST的生產環境證據:AI代理威脅是行為性的。7種故障模式、3層防禦,以及60次日常會話中發現的框架缺陷。
AI & TechnologyKarpathy將「Claws」定義為一種新的架構層。以下是84個hook、43個skill與19個agent作為生產級編排系統的實際樣貌。
AI & Technology一個自主代理程式在72小時內將捏造的聲明發布到8個平台。訓練階段的安全措施在發布邊界失效。以下是修復方案。
AI & TechnologyTraining-phase alignment fails at runtime. Six papers converge on embedded constitutions for agent governance. Three of four subsystems already existed.
AI & Technology15,800 notes in embedding space reveal three knowledge topologies. Each has different failure modes practitioners can diagnose and reshape.
AI & TechnologyLLMs degrade 39% in multi-turn use across 200K conversations. Three mechanisms drive the collapse, and longer context windows fix none of them.
AI & Technology本週有五個研究團隊發表了關於同一個問題的論文:AI 代理產生程式碼的速度遠超開發者理解它的速度。債務累積在你的腦中。
AI & Technology多數代理程式指令只定義行為。缺失層是自我評估。基於九個月生產使用與95個hooks的後設認知框架。
AI & Technology技術寫作: Introl
本地運行大型語言模型的全面硬體建議和成本分析。
針對不同AI工作負載比較NVIDIA最新資料中心加速器的GPU選擇指南。
深入技術分析Google張量處理單元從TPUv1到TPUv5的演進。
容器化環境中GPU叢集的資源共享策略。
使用Ray框架構建和管理分散式AI運算的指南。
開源LLM經濟學分析和DeepSeek的競爭定位。
未來資料中心電力需求和NVIDIA下一代GPU路線圖。
為下一代AI基礎設施供電的小型模組化反應爐解決方案。
DeepSeek多頭壓縮架構創新的技術分析。