コンパウンドコンテキスト：AIプロジェクトは長く関わるほど良くなる理由

1分で読めます

6ヶ月前、resumegeniプロジェクトのコーディングタスクには、セッション丸ごと使って説明する必要がありました。エージェントはコードを1行触る前に、データベーススキーマ、ルーティング規約、テンプレート継承、キャッシュレイヤー、デプロイパイプライン、テストパターンを理解しなければなりませんでした。毎回ゼロからのスタートです。

先週、「マーケットページのパフォーマンスを直して」と伝えただけで、エージェントは前回のセッションから引き継がれたハンドオフドキュメントを読み、market_hub()のボトルネックを特定し、集約RPCを使ったページネーション付きデータベースクエリを実装し、テストを書き、デプロイを完了しました。Austinのレスポンスは14秒から108ミリ秒へ。エージェントが賢くなったわけではありません。プロジェクトが豊かになったのです。

違いはモデルではありません。プロジェクトを取り巻く蓄積されたコンテキストです。規約を記述するCLAUDE.md、意思決定を記録するメモリファイル、セッション間の診断を保存するハンドオフドキュメント、制約を強制するフック、ワークフローをエンコードするスキル、正確性を検証するテストスイート、何をなぜ出荷したかを記録するキャプテンズログ。各アーティファクトは特定の問題を解決するために作られました。それらが合わさることで、後続のあらゆる問題の解決コストが下がっていきます。

これがコンテキストの複利効果です。

TL;DR

コンテキストの複利効果とは、AIを活用したプロジェクトが長く取り組むほど改善速度が上がる現象です。解決済みの問題が再利用可能なコンテキストとして蓄積され、次の問題を解くコストを下げるためです。
セッション間でモデルが向上するわけではありません。向上するのはプロジェクトのインフラです。CLAUDE.mdファイル、メモリシステム、フック、スキル、ハンドオフドキュメント、テストカバレッジ、命名規約、運用ログがそれにあたります。
コンテキストの複利効果は、AIエージェントで新しいプロジェクトを始めると遅く感じるのに、同じプロジェクトの500回目のセッションが速く感じる理由を説明します。最初のセッションはコンテキストを構築し、500回目のセッションはそれを使います。
この効果は自動的に起きるものではありません。コンテキストアーティファクトへの意図的な投資が必要です。意思決定を記録するドキュメント、制約をエンコードするフック、仮定を検証するテスト、運用履歴を保存するログです。
コンテキストの複利効果を理解している組織は、エンジニアを四半期ごとにプロジェクト間でローテーションするのをやめ、蓄積されたプロジェクトコンテキストを資本資産として扱い始めるでしょう。

何が複利的に蓄積されるか

コンテキストの複利効果は、蓄積されたプロジェクト知識の6つのカテゴリを通じて作用します。各カテゴリが異なる種類のリターンを生み出します。

規約ドキュメント（CLAUDE.md）。 CLAUDE.mdファイルは、プロジェクトの仕組みをすべてのエージェントセッションに伝えます。ファイル構造、命名規約、インポートパターン、テスト手法、デプロイプロセスなどです。CLAUDE.mdなしの最初のセッションは、規約の発見に多くの労力を費やします。成熟したCLAUDE.mdがある100回目のセッションでは、その労力はゼロになります。一度記録された規約は二度と説明し直す必要がないため、ドキュメントは複利的に効果を発揮します。

意思決定メモリ。 メモリファイルは、何が決められたかだけでなく、なぜそう決められたかを記録します。将来のセッションが同じトレードオフに遭遇したとき、答えを再導出する代わりにメモリを読みます。私のメモリシステムはプロジェクトの意思決定、ユーザーの好み、フィードバックの修正、参照ポインタを保存しています。個々のメモリは小さくても、コレクション全体が意思決定キャッシュとして機能し、プロジェクトが解決済みの問題を蒸し返すのを防ぎます。

ハンドオフドキュメント。 ハンドオフドキュメントは、セッション境界を越えて診断結果を保存します。マーケットページのパフォーマンスに関するハンドオフは、3回のコードレビュー修正と2回の優先順位の変更を経て、最終的に4日後の実装を導きました。ハンドオフがなければ、次のセッションは調査をゼロから始め、最初のドラフトがそうだったように、おそらく間違ったコードパスをターゲットにしていたでしょう。ハンドオフは、診断にかかる時間を再利用可能なアーティファクトに変換することで複利効果を生み出しました。

フックと制約。 すべてのフックは、過去の失敗から学んだ教訓をエンコードしたものです。私の破壊的APIガードは、エージェントがCloudflareキャッシュを丸ごとパージしたから存在します。サンドボックスフックは、エージェントが~/.ssh/に書き込もうとしたから存在します。ドリフト検出器は、60日間に12回エージェントがタスクを見失ったから存在します。各フックは、同じ種類の障害が将来のすべてのセッションで再発するのを防ぎます。フックが複利効果を持つのは、インシデント対応を恒久的な予防策に変換するからです。

スキルとワークフロー。 スキルとは、エージェントがプロセスを再発明することなく実行できる、体系化されたワークフローです。/nightcheckスキルは50以上のページチェックをTTFBベンチマーク、キャッシュ検証、包括的なサイトマップクロールとともに実行します。/scan-intelスキルは8つの研究トピックにわたって6つの学術ソースを重複排除とスコアリング付きで検索します。/blog-translatorスキルは投稿を9つのロケールにフォーマットを保持しながら翻訳します。各スキルは一度構築するのにコストがかかりますが、以降は永遠に無料で実行できます。プロセス知識を実行可能な自動化に変換するからこそ、スキルは複利的に蓄積されるのです。

テストスイート。 テストは、変更後もプロジェクトが正しく動作することを検証します。成熟したテストスイートがあれば、エージェントは自信を持って大胆な変更を行えます。失敗が即座にキャッチされるからです。テストのないプロジェクトでは、エージェントは作業を検証できないため、保守的で段階的な変更を強いられます。テストカバレッジが複利効果を持つのは、各テストが将来の変更をより安く、より安全にするからです。

複利効果の曲線

コンテキストの複利効果には特徴的な曲線があります。

セッション1〜10：投資フェーズ。 労力の大半は、機能を提供するのではなくコンテキストの構築に使われます。CLAUDE.mdを書き、規約を確立し、最初のフックを作り、テストフレームワークをセットアップする段階です。インフラを構築しているのであってプロダクトを構築しているのではないため、アウトプットは遅く感じられます。

セッション10〜50：加速フェーズ。 コンテキストが価値を返し始めます。エージェントは規約について質問するのをやめ、それに従い始めます。フックがデプロイ前にミスをキャッチし、スキルが繰り返しのワークフローを自動化します。コンテキスト基盤が成長しているため、各セッションのアウトプットは前回を上回ります。

セッション50〜200：複利フェーズ。 蓄積されたコンテキストが十分にあるため、難しい問題が簡単になります。成熟したCLAUDE.md、メモリファイル群、ハンドオフドキュメントを読んだエージェントは、追加のガイダンスなしに複雑な複数ステップの実装を実行できます。マーケットページの修正はこのフェーズで起きました。「マーケットページのパフォーマンスを直して」という一文が、132倍の改善で終わる4日間のプロセスを始動させたのは、コンテキストインフラが診断、制約、検証基準を担っていたからです。

セッション200以降：メンテナンスフェーズ。 ほとんどの規約、制約、ワークフローが既にキャプチャされているため、新しいコンテキスト作成の速度は鈍化します。焦点はゼロからのコンテキスト作成ではなく、既存コンテキストの更新（古いメモリの修正、スキルの拡張、新しいエッジケースのテスト追加）に移ります。複利効果はプラトーに達しますが、高い水準を維持します。

なぜこれが見えにくいのか

3つの要因が複利効果を覆い隠しています。

モデルの改善がコンテキストの改善を覆い隠す。 AIセッションが時間とともに改善すると、その改善をより良いモデルのおかげだと考えがちです。Claude Opus 4.6はClaude 3.5 Sonnetより確かに優れています。しかし、長期間続くプロジェクトで体験する改善はモデルの改善を超えています。コンテキストの複利効果がモデルの改善の上に積み重なるからです。同じモデルで新しいプロジェクトに切り替えると、その違いが明らかになります。複利コンテキストがないため、新しいプロジェクトは遅く感じるのです。

コンテキストは目に見えない。 CLAUDE.mdファイルはテキストドキュメントです。メモリファイルはMarkdownのメモです。フックはシェルスクリプトです。これらのアーティファクトは個別に見ると印象的には見えません。複利効果は単一のアーティファクトには現れず、完全なコンテキストスタックに対して動作するセッションの総合的な振る舞いにのみ現れます。「このファイルのおかげでプロジェクトが速い」と指さすことはできません。500回目のセッションと1回目のセッションを比較して、初めて違いに気づくのです。

新しいプロジェクトの開始はワクワクする。 新しいプロジェクトには新鮮なエネルギーがあり、蓄積された負債がありません。しかし、蓄積されたコンテキストもありません。新しいプロジェクトの最初のセッションは、インパクトのあるハイレベルな意思決定を行うため、生産的に感じられます。既存プロジェクトの20回目のセッションは、確立された規約の中で実行するため、ルーチンに感じられます。ルーチンに感じるのは複利効果が働いている証拠であり、ワクワク感はその不在の表れなのです。

複利効果を妨げるもの

4つの失敗モードが複利曲線を壊します。

コンテキストの腐敗。 古いメモリ、陳腐化したCLAUDE.mdのセクション、非推奨のフックは、明確さではなく混乱を生みます。古い規約に従うエージェントは、規約のないエージェントよりも悪い結果を出します。コンテキストにはメンテナンスが必要です。私のメモリシステムには最終更新タイムスタンプと明示的な陳腐化チェックが含まれています。死んだコンテキストは、コンテキストがないことより悪いのです。

コンテキストの無秩序な拡大。 ファイルが多すぎ、フックが多すぎ、スキルが多すぎると、発見の問題が生まれます。エージェントが関連するコンテキストを見つけられなければ、そのコンテキストは複利効果を生みません。整理が重要です。私のメモリファイルは、将来のセッションが全文を読まずに関連性を評価できるよう、説明付きのフロントマターを使っています。フックは、イベントタイプごとにロードするディスパッチャに登録されています。発見可能なコンテキストは複利効果を生みます。埋もれたコンテキストは腐敗します。

セッションの孤立。 セッションが永続的なコンテキストを読み書きしなければ、毎回ゼロから始まります。複利効果には意図的な橋渡しが必要です。セッション間で診断を引き継ぐハンドオフドキュメント、意思決定を記録するメモリの書き込み、運用履歴を残すキャプテンズログです。これらの橋渡しがなければ、500セッションのプロジェクトも、1セッションのプロジェクトと実質的に同じコンテキストしか持ちません。

プラットフォームの変動。 AIツールの切り替えはコンテキストスタックをリセットします。あるプラットフォーム向けに書かれたCLAUDE.mdは、別のプラットフォームを自動的に助けるわけではありません。あるプラットフォームのイベントモデル向けに書かれたフックは、別のプラットフォームでは発火しません。コンテキストの複利効果はプラットフォーム固有であり、ロックインを生み出すと同時にそれが堀にもなります。あるプラットフォーム上のコンテキストスタックが深いほど、切り替えコストは高くなり、切り替え続ける競合他社に対してプロジェクトの改善速度は相対的に速くなります。

資本としてのコンテキストの複利効果

金融における複利は、十分な時間があれば小さな預金を大きな額に変えます。重要なのは、リターン自体がさらなるリターンを生むという点です。コンテキストの複利効果も同じように働きます。

CLAUDE.mdにキャプチャされた規約は、将来のすべてのセッションで再説明を減らします。節約された時間は新しい問題の解決に使われ、新しい規約が生まれ、それがさらに将来の再説明を減らします。ある種の障害を防ぐフックは、将来のすべてのセッションでその障害の再調査を排除します。節約された時間は新しい障害クラスのための新しいフック構築に使われます。各投資がさらなる投資を可能にするリターンを生むのです。

組織にとっての示唆：プロジェクトコンテキストは資本資産です。エンジニアを四半期ごとにプロジェクト間でローテーションすることは、貯蓄口座を解約して複利を破壊するのと同じです。AIの支援を受けながら同じプロジェクトに2年間留まるチームは、四半期ごとにローテーションするチームを上回るでしょう。個人が優れているからではなく、コンテキストが複利的に蓄積されているからです。

個人のエンジニアにとっての示唆：AIインフラは投資ポートフォリオです。CLAUDE.mdのセクション、メモリファイル、フック、スキル、ハンドオフドキュメントのすべてが預金です。ポートフォリオは最初ゆっくり成長します。数百セッション後には、難しい問題がコンテキストスタックを見ていない観察者には簡単に見えるほどのリターンを生み出します。

マーケットページは14秒から108ミリ秒になりました。観察者にはパフォーマンス修正に見えるでしょう。私に見えるのは、3回の修正を生き延びたハンドオフドキュメント、リグレッションを計測したnightcheckシステム、キャッシュパージの再発を防いだ破壊的ガード、間違った最初のターゲットをキャッチしたコードレビュースキル、そしてすべてを可能にした500セッション分の蓄積されたコンテキストです。

これがコンパウンドコンテキストです。

FAQ

コンテキストの複利効果とは何ですか？

コンテキストの複利効果とは、AIを活用したプロジェクトが時間とともにより速く改善する現象です。解決済みの問題が再利用可能なコンテキスト（ドキュメント、フック、スキル、テスト、メモリ）として蓄積され、後続の問題を解くコストを下げるためです。複利と同様に、リターン自体がさらなるリターンを生み出します。

どのAIツールでも機能しますか？

原理は広く適用できますが、実装はツールが永続的なコンテキストをどの程度サポートしているかに依存します。Claude CodeはCLAUDE.mdファイル、フック、スキル、メモリシステムをネイティブにサポートしています。他のツールでは同じ効果を得るために外部のスキャフォールディングが必要になる場合があります。コンテキストの永続化メカニズムが多いプラットフォームほど、複利曲線はより急になります。

コンパウンドコンテキストの構築はどう始めればよいですか？

まず、プロジェクトの規約を記述するCLAUDE.mdから始めましょう。重要な意思決定にはメモリファイルを追加します。経験した障害パターンにはフックを書きます。セッション間で繰り返すワークフローにはスキルを作成します。初期は投資感が強いですが、10〜20セッション後にリターンが現れ始めます。

これは単なるドキュメンテーションですか？

いいえ。ドキュメンテーションは一つの要素ですが、コンテキストの複利効果には実行可能なアーティファクトも含まれます。実行時に制約を強制するフック、ワークフローを自動化するスキル、正確性を検証するテストスイート、意思決定に情報を提供するメモリシステムです。静的なドキュメンテーションは説明するだけですが、コンパウンドコンテキストは行動します。

コンテキストウィンドウの制限はどうなりますか？

コンテキストの複利効果は、すべてのコンテキストを毎回のセッションにロードすることを要求しません。必要なときに適切なコンテキストが利用可能であることが重要です。CLAUDE.mdは自動的にロードされます。メモリファイルは関連性に基づいてクエリされます。ハンドオフドキュメントは特定のタスクを継続するときに読まれます。コンテキストスタックは単一のコンテキストウィンドウより大きくても、エージェントはセッションごとに関連するスライスにアクセスするのです。

自分のプロジェクトにコンパウンドコンテキストがあるかどうか、どうすれば分かりますか？

プロジェクトの歴史の初期と後期で、類似のタスクに必要な労力を比較してください。1ヶ月目にセッション丸ごとかかったタスクが、6ヶ月目には一つのプロンプトで済むなら、コンパウンドコンテキストが機能しています。労力が同じなら、コンテキストが蓄積されていないか、セッション間で永続化されていません。

出典

この記事は、2025年5月以降の6つのプロジェクトにわたる500回以上の自律コーディングセッションの実務経験に基づいています。参照した具体例：

マーケットページのパフォーマンス：ハンドオフドキュメント、nightcheck検証、デプロイについて、2026年3月21日〜25日のキャプテンズログに記述
破壊的APIガード：エージェントがCloudflareキャッシュを丸ごとパージした後に構築。deploy-and-defendの投稿に記述
フックとスキルのインフラ：15のイベントタイプをインターセプトする84のフック。NISTコメントに記述
ドリフト検出：60以上のセッションにわたるコサイン類似度追跡。The Invisible Agentに記述
自動リサーチループ：Apple Silicon上の固定予算実験。Claudini論文で検証
AnthropicによるClaude Codeのメモリとプロジェクト指示に関するドキュメント：Manage Claude’s memory
Andrej Karpathyのautoresearchリポジトリ：autoresearch