複合情境:為什麼 AI 專案越長期投入越出色
六個月前,我在 resumegeni 專案中的一項程式任務耗費了整個工作階段來解釋。代理需要理解資料庫結構、路由慣例、模板繼承、快取層、部署流程和測試模式,才能動一行程式碼。每次工作階段都從零開始。
上週,我只說了一句「修復市場頁面效能」,代理便讀取了前一個工作階段的交接文件,定位到 market_hub() 中的瓶頸,實作了帶有聚合 RPC 的分頁資料庫查詢,撰寫測試並完成部署。Austin 的載入時間從 14 秒降至 108 毫秒。代理並沒有變聰明,是專案變得更豐富了。
關鍵差異不在模型,而在專案周圍累積的情境:描述慣例的 CLAUDE.md、記錄決策的記憶檔案、跨工作階段保存診斷的交接文件、執行約束的鉤子、編碼工作流程的技能、驗證正確性的測試套件、記載交付內容與原因的艦長日誌。每個產物都是為了解決特定問題而生,但匯聚在一起,就能讓後續每個問題的解決成本持續降低。
這就是情境複利效應。
摘要
- 情境複利效應是一種現象:AI 輔助的專案隨著投入時間增長而加速進步,因為已解決的問題會沉澱可重複使用的情境,降低解決下一個問題的成本。
- 模型在工作階段之間並未進步,進步的是專案基礎設施:CLAUDE.md 檔案、記憶系統、鉤子、技能、交接文件、測試覆蓋率、命名慣例和營運日誌。
- 情境複利效應解釋了為何用 AI 代理啟動新專案感覺緩慢,而同一專案的第 500 次工作階段卻行雲流水。第一次工作階段建立情境,第 500 次工作階段運用情境。
- 這種效應並非自動發生,需要有意識地投資情境產物:記錄決策的文件、編碼約束的鉤子、驗證假設的測試、保存營運歷史的日誌。
- 理解情境複利效應的組織將不再每季輪調工程師,而是開始將累積的專案情境視為資本資產。
哪些情境會複利成長
情境複利效應透過六類累積的專案知識運作,每一類產生不同類型的回報。
慣例文件(CLAUDE.md)。 CLAUDE.md 檔案告訴每個代理工作階段專案的運作方式:檔案結構、命名慣例、匯入模式、測試方法、部署流程。沒有 CLAUDE.md 的第一次工作階段,大量精力花在探索慣例上。擁有成熟 CLAUDE.md 的第一百次工作階段,這方面的開銷為零。文件之所以能複利成長,是因為每條慣例只需記錄一次,從此無需再次說明。
決策記憶。 記憶檔案記錄的是決策的原因,而非僅僅記錄決策本身。當未來的工作階段遇到相同的取捨,它直接讀取記憶,而非重新推導答案。我的記憶系統儲存專案決策、使用者偏好、回饋修正和參考指引。每筆記憶都很小,但整個集合構成一個決策快取,防止專案反覆爭論已定案的問題。
交接文件。 交接文件將診斷結果跨工作階段保存下來。市場頁面效能的交接文件經歷了三次程式碼審查修正、兩次優先順序調整,最終在四天後指導了實作。沒有交接文件,下一個工作階段將從頭開始調查,很可能瞄準錯誤的程式碼路徑(初稿確實如此)。交接文件的複利效應在於:將診斷時間轉化為可重複使用的產物。
鉤子與約束。 每個鉤子都編碼了過去某次失敗的教訓。我的破壞性 API 防護機制之所以存在,是因為一個代理曾清除了整個 Cloudflare 快取。我的沙箱鉤子之所以存在,是因為一個代理曾試圖寫入 ~/.ssh/。我的偏移偵測器之所以存在,是因為代理在六十天內十二次偏離任務。每個鉤子都能防止同類失敗在所有未來工作階段中再次發生。鉤子的複利效應在於:將事件回應轉化為永久性預防。
技能與工作流程。 技能是一套編碼化的工作流程,代理無需重新發明流程即可執行。我的 /nightcheck 技能執行 50 多項頁面檢查,包含 TTFB 基準測試、快取驗證和全面的網站地圖爬取。我的 /scan-intel 技能在八個研究主題中搜尋六個學術來源,並進行去重和評分。我的 /blog-translator 技能將文章翻譯成九種語言,同時保留格式。每項技能的建置成本只需一次,之後永久免費執行。技能的複利效應在於:將流程知識轉化為可執行的自動化。
測試套件。 測試驗證專案在修改後仍能正常運作。成熟的測試套件讓代理能大膽修改,因為錯誤會立即被捕捉。沒有測試的專案迫使代理採取保守、漸進的修改方式,因為無法驗證工作成果。測試覆蓋率的複利效應在於:每增加一項測試,都讓未來的修改更廉價、更安全。
複利成長曲線
情境複利效應遵循一條特徵曲線。
第 1-10 次工作階段:投資期。 大部分精力用於建立情境而非交付功能。您撰寫 CLAUDE.md、確立慣例、建立首批鉤子、搭建測試框架。產出感覺緩慢,因為您正在建設基礎設施,而非產品。
第 10-50 次工作階段:加速期。 情境開始產生回報。代理不再詢問慣例,而是直接遵循。鉤子在部署前攔截錯誤。技能自動化重複性工作流程。每次工作階段的產出都超越前一次,因為情境基底持續擴大。
第 50-200 次工作階段:複利期。 專案已累積足夠的情境,使困難問題變得容易。代理讀取成熟的 CLAUDE.md、一組記憶檔案和交接文件後,無需額外指導即可執行複雜的多步驟實作。市場頁面修復就發生在這個階段。一句話(「修復市場頁面效能」)觸發了一個四天的流程,最終實現 132 倍的效能提升——因為情境基礎設施承載了診斷、約束和驗證標準。
第 200 次以上工作階段:維護期。 新情境的創建速度放緩,因為大多數慣例、約束和工作流程已被記錄。重心轉向更新現有情境(修正過時的記憶、擴展技能、為新邊界案例增加測試),而非從頭建立。複利效應趨於平穩,但仍維持在高水準。
為何這並不顯而易見
三個因素遮蔽了複利效應。
模型進步掩蓋了情境進步。 當 AI 工作階段隨時間改善時,您會將進步歸因於更好的模型。Claude Opus 4.6 確實優於 Claude 3.5 Sonnet。但您在長期專案中體驗到的進步超出了模型本身的提升,因為情境複利效應疊加在模型進步之上。切換到同一模型上的新專案就能揭示差異:新專案感覺緩慢,因為它沒有複合情境。
情境是隱形的。 CLAUDE.md 是文字檔,記憶檔案是 Markdown 筆記,鉤子是 shell 腳本。這些產物單獨看來都不起眼。複利效應不會顯現在任何單一產物中,只有在觀察工作階段對完整情境堆疊運作時的整體行為時才可見。您無法指著某個檔案說「這就是專案快速的原因」。您只能比較第 500 次和第 1 次工作階段,才能察覺差異。
啟動新專案令人興奮。 新專案充滿新鮮感,沒有累積的技術債。但同樣沒有累積的情境。新專案的第一次工作階段感覺成效顯著,因為做出的高層決策看似影響深遠。現有專案的第 20 次工作階段感覺例行公事,因為它在既定慣例中執行。這種例行感正是複利效應在運作。而那種興奮感,恰恰是複利效應的缺席。
阻礙複利效應的因素
四種失敗模式會打斷複利曲線。
情境腐化。 過時的記憶、陳舊的 CLAUDE.md 段落、棄用的鉤子會製造混亂而非帶來清晰。代理遵循過時慣例所產生的輸出,比沒有慣例時更糟。情境需要維護。我的記憶系統包含最後更新時間戳和明確的過時檢查。腐化的情境比沒有情境更糟。
情境蔓生。 過多的檔案、過多的鉤子、過多的技能會造成發現困難。如果代理找不到相關情境,情境就無法產生複利。組織至關重要:我的記憶檔案使用帶有描述的前置資料,讓未來工作階段無需讀取全文即可評估相關性。我的鉤子透過調度器按事件類型載入。可被發現的情境會複利成長,被埋沒的情境只會腐化。
工作階段隔離。 如果工作階段既不讀取也不寫入持久化情境,每次都從零開始。複利效應需要有意識的橋接:承載跨階段診斷的交接文件、記錄決策的記憶寫入、記載營運歷史的艦長日誌。缺少這些橋接,一個歷經 500 次工作階段的專案,其有效情境與只有一次工作階段的專案無異。
平台更迭。 在不同 AI 工具之間切換會重置情境堆疊。為某個平台撰寫的 CLAUDE.md 不會自動幫助另一個平台。為某個平台事件模型撰寫的鉤子不會在另一個平台上觸發。情境複利效應是平台特定的,這既形成了鎖定效應,也構築了護城河。您在某個平台上的情境堆疊越深,切換成本越高,專案相對於不斷更換平台的競爭者改進也越快。
情境複利作為資本
在金融領域,複利能讓小額存款在足夠時間後變成鉅額財富。核心洞察在於:回報本身會產生進一步的回報。情境複利效應的運作原理如出一轍。
記錄在 CLAUDE.md 中的慣例,減少了未來每次工作階段中的重複說明。節省下來的時間用於解決新問題,產生新慣例,進一步減少未來的重複說明。防止某類失敗的鉤子,在每次未來工作階段中消除了對該類失敗的重複調查。節省下來的時間用於為新的失敗類別建立新鉤子。每筆投資都產生回報,而回報又促成進一步的投資。
對組織的啟示:專案情境是一種資本資產。每季輪調工程師所摧毀的累積情境,如同關閉儲蓄帳戶摧毀累積利息。一個團隊在同一專案上搭配 AI 輔助持續兩年,將勝過每季輪調的團隊——並非因為個人更優秀,而是因為情境已經複利成長。
對個人工程師的啟示:您的 AI 基礎設施是一個投資組合。每段 CLAUDE.md 內容、每個記憶檔案、每個鉤子、每項技能、每份交接文件都是一筆存款。投資組合初期增長緩慢。經過數百次工作階段後,它產生的回報足以讓困難問題在旁觀者眼中輕而易舉——因為他們看不到底下的情境堆疊。
市場頁面從 14 秒降至 108 毫秒。旁觀者看到一次效能修復。我看到的是一份經歷三次修訂的交接文件、一個測量到迴歸的夜間檢查系統、一個防止快取清除重演的破壞性防護機制、一個攔截初始錯誤目標的程式碼審查技能,以及五百次工作階段累積的情境——是這一切讓整件事成為可能。
這就是複合情境。
常見問題
什麼是情境複利效應?
情境複利效應是一種現象:AI 輔助的專案隨時間加速進步,因為已解決的問題會沉澱可重複使用的情境(文件、鉤子、技能、測試、記憶),降低解決後續問題的成本。這個概念類比於複利:回報本身會產生進一步的回報。
這適用於任何 AI 工具嗎?
原則普遍適用,但具體實作取決於工具對持久化情境的支援程度。Claude Code 原生支援 CLAUDE.md 檔案、鉤子、技能和記憶系統。其他工具可能需要外部腳手架才能達到同等效果。提供越多情境持久化機制的平台,複利曲線越陡峭。
如何開始建立複合情境?
從撰寫描述專案慣例的 CLAUDE.md 開始。為關鍵決策添加記憶檔案。為過去經歷的失敗模式撰寫鉤子。為跨工作階段重複的工作流程建立技能。初期投資感覺緩慢,回報會在 10-20 次工作階段後顯現。
這不就是寫文件嗎?
並非如此。文件是其中一個元件,但情境複利效應還包括可執行的產物:在執行時強制約束的鉤子、自動化工作流程的技能、驗證正確性的測試套件、輔助決策的記憶系統。靜態文件只能解釋,複合情境能夠行動。
情境視窗限制怎麼辦?
情境複利效應不要求每次工作階段載入全部情境,而是需要在需要時提供正確的情境。CLAUDE.md 會自動載入,記憶檔案按相關性查詢,交接文件在延續特定任務時讀取。情境堆疊大於任何單一情境視窗,代理每次存取的是相關切片。
如何判斷我的專案是否具備複合情境?
比較專案早期和後期完成類似任務所需的精力。如果第一個月需要整個工作階段才能完成的任務,到第六個月只需一條提示就能搞定,複合情境正在發揮作用。如果精力相當,說明情境沒有累積,或者沒有在工作階段之間持久化。
參考來源
本文取材自 2025 年 5 月以來,橫跨六個專案、500 多次自主編程工作階段的生產實務經驗。文中引用的具體案例:
- 市場頁面效能:交接文件、夜間檢查驗證和部署過程記錄於 2026 年 3 月 21-25 日的艦長日誌
- 破壞性 API 防護機制:在一個代理清除整個 Cloudflare 快取後建立,詳見部署與防禦一文
- 鉤子與技能基礎設施:84 個鉤子攔截 15 種事件類型,詳見 NIST 意見書
- 偏移偵測:跨 60 多次工作階段的餘弦相似度追蹤,詳見隱形代理
- 自動研究迴圈:在 Apple Silicon 上進行固定預算實驗,由 Claudini 論文驗證
- Anthropic 關於 Claude Code 記憶與專案指令的文件:管理 Claude 的記憶
- Andrej Karpathy 的自動研究儲存庫:autoresearch