Agent 操作員手冊:監督看不見的工作
操作自主 AI agent 是一門全新的專業。五項職責、一套監督架構與一個介入框架,定義了操作員的角色。
AI & Technology關於設計、開發、AI基礎設施和產品構建的思考。
操作自主 AI agent 是一門全新的專業。五項職責、一套監督架構與一個介入框架,定義了操作員的角色。
AI & Technology聊天適合提示輸入,但無法勝任代理操作。六種介面模式以真正的控制面板取代滾動文字視窗。
AI & TechnologyClawGuard 證明確定性工具呼叫攔截確實可行。Vercel 遙測事件則說明了箇中原因。執行期防禦才是可強制執行的防線。
AI & Technology當人類不再閱讀程式碼,驗證層該是什麼樣貌?深入剖析全自主 AI 編碼所需的基礎設施。
AI EngineeringClaude Mythos 在 10 次嘗試中有 3 次完成了 32 步驟的企業網路攻擊模擬。每次嘗試耗費 12,500 美元的 token 費用。安全防護現已成為一場支出競賽。
AI & TechnologyACL 2026 論文量測了現有評估遺漏的 LLM 記憶:無意識行為適應。頂尖模型得分不到 66%。這種不對稱性至關重要。
AI & Technology一旦沒人觀察軌跡資料,代理技能就會在那一刻開始衰退。一篇關於跨使用者技能演化的新論文,點出了問題本身與解方。
AI & Technology研究人員測試了 28 個LLM API路由器。其中 17 個接觸了 AWS 的誘餌憑證,1 個從私鑰中抽走了 ETH。路由器層就是新的攻擊面。
AI & Technology50 個 MCP 漏洞,60 天內 30 個 CVE,13 個嚴重等級。工具使用協定是無人稽核的攻擊面——以下是分類與修復方案。
AI & TechnologyAnthropic打造了一個能找出數千個零日漏洞的模型,隨後將其限制給12個合作夥伴使用。Project Glasswing對於代理輔助安全的意義——4月19日更新,內容涵蓋Opus 4.7、現已上線的Cyber Verification Program與v2.1.113沙箱強化。
AI & Technology一位 Anthropic 研究員使用 Claude Code 與一個 10 行的 bash 腳本,找到了一個存在 23 年的 Linux 核心漏洞。接著又揭露了 22 個 Firefox CVE。
AI & Technology從 Claude Code 原始碼外洩中得出的 11 項發現:自動模式、bash 安全防護、提示快取與多代理協調實際運作的方式。
AI & Technology技術寫作: Introl
本地運行大型語言模型的全面硬體建議和成本分析。
針對不同AI工作負載比較NVIDIA最新資料中心加速器的GPU選擇指南。
深入技術分析Google張量處理單元從TPUv1到TPUv5的演進。
容器化環境中GPU叢集的資源共享策略。
使用Ray框架構建和管理分散式AI運算的指南。
開源LLM經濟學分析和DeepSeek的競爭定位。
未來資料中心電力需求和NVIDIA下一代GPU路線圖。
為下一代AI基礎設施供電的小型模組化反應爐解決方案。
DeepSeek多頭壓縮架構創新的技術分析。