What is an AI agent harness?

An agent harness is the configuration layer that turns a base AI coding agent like Claude Code into a specialized development environment. It consists of CLAUDE.md project instructions, skills (reusable prompt templates), hooks (shell scripts triggered by lifecycle events), memory (persistent file-based context), and subagents (isolated child processes for parallel work). The harness constrains, extends, and orchestrates the agent's behavior without modifying its source code.

What is the difference between skills and hooks in Claude Code?

Skills are prompt templates invoked by the user or agent (like slash commands) that inject context and instructions. Hooks are shell scripts triggered automatically by lifecycle events (PreToolUse, PostToolUse, etc.) that run outside the model's control — the model cannot skip or modify them. Skills tell the agent what to do; hooks enforce what must happen regardless of what the agent decides.

How do subagents work in Claude Code?

Subagents are isolated child processes spawned via the Agent tool. Each subagent gets its own context window, can run in the background, and can optionally use git worktrees for file isolation. They communicate results back to the parent through a single return message. Subagents enable parallel research, code review, testing, and multi-agent deliberation patterns.

How does memory work across Claude Code sessions?

Claude Code uses file-based memory stored in ~/.claude/projects/ /memory/. A MEMORY.md index file is automatically loaded into every conversation. Individual memory files use YAML frontmatter with type (user, feedback, project, reference), name, and description fields. Memory persists across sessions and conversations, enabling the agent to retain user preferences, project context, and learned corrections.

When should I use a skill vs a hook vs a subagent?

Use skills for reusable workflows the user or agent invokes on demand (code review, deployment, translation). Use hooks for mandatory enforcement that must happen regardless of agent behavior (security checks, formatting, logging). Use subagents for parallel or isolated work that would clutter the main context (research, testing, background tasks). Use memory for information that must persist across sessions.

agent:~/.claude$ cat agent-architecture.md

 █████╗  ██████╗ ███████╗███╗   ██╗████████╗
██╔══██╗██╔════╝ ██╔════╝████╗  ██║╚══██╔══╝
███████║██║  ███╗█████╗  ██╔██╗ ██║   ██║
██╔══██║██║   ██║██╔══╝  ██║╚██╗██║   ██║
██║  ██║╚██████╔╝███████╗██║ ╚████║   ██║
╚═╝  ╚═╝ ╚═════╝ ╚══════╝╚═╝  ╚═══╝   ╚═╝

에이전트 아키텍처: AI 기반 개발 하니스 구축하기

# 프로덕션 AI 에이전트 하니스를 구축하기 위한 완전한 시스템입니다. 스킬, 훅, 메모리, 서브에이전트, 멀티 에이전트 오케스트레이션, 그리고 AI 코딩 에이전트를 신뢰할 수 있는 인프라로 만드는 패턴을 다룹니다.

words: 10579 read_time: 53m updated: 2026-05-09 06:20

$ less agent-architecture.md

TL;DR: Claude Code는 파일 접근이 가능한 채팅창이 아닙니다. 문서화된 29개의 라이프사이클 이벤트를 갖춘 프로그래밍 가능한 런타임이며, 각 이벤트는 모델이 건너뛸 수 없는 셸 스크립트로 후킹할 수 있습니다. 후크를 디스패처로 쌓고, 디스패처를 skills로, skills를 에이전트로, 에이전트를 워크플로로 쌓아 올리면, 제약을 강제하고, 작업을 위임하며, 세션 간에 메모리를 보존하고, 다중 에이전트 심의를 조율하는 자율 개발 harness가 만들어집니다. 이 가이드는 단일 후크부터 10개 에이전트 합의 시스템까지 그 스택의 모든 계층을 다룹니다. 프레임워크는 전혀 필요하지 않습니다. 전부 bash와 JSON로 구현됩니다.

Andrej Karpathy는 LLM 에이전트 주위에서 자라나는 것을 가리키는 용어를 만들었습니다. 바로 claws입니다. 에이전트가 컨텍스트 윈도 바깥의 세계를 움켜쥘 수 있게 해주는 후크, 스크립트, 그리고 오케스트레이션을 의미합니다.¹ 대부분의 개발자는 AI 코딩 에이전트를 대화형 어시스턴트로 취급합니다. 프롬프트를 입력하고, 파일이 수정되는 것을 지켜보고, 다음으로 넘어가죠. 이런 관점은 생산성을 본인이 직접 감독할 수 있는 범위로 제한합니다.

인프라 관점의 멘탈 모델은 다릅니다. AI 코딩 에이전트는 LLM 커널을 가진 프로그래밍 가능한 런타임입니다. 모델이 취하는 모든 동작은 여러분이 통제하는 후크를 거쳐 갑니다. 프롬프트가 아니라 정책을 정의하는 것입니다. 모델은 웹 서버가 nginx 규칙 안에서 작동하는 것과 같은 방식으로 여러분의 인프라 안에서 작동합니다. 여러분은 nginx 앞에 앉아 요청을 직접 입력하지 않습니다. 설정하고, 배포하고, 모니터링할 뿐이죠.

이 구분이 중요한 이유는 인프라는 복리로 누적되기 때문입니다. bash 명령어에서 자격 증명을 차단하는 후크는 모든 세션, 모든 에이전트, 모든 자율 실행을 보호합니다. 평가 기준을 인코딩한 skill은 여러분이 호출하든 에이전트가 호출하든 동일하게 적용됩니다. 보안을 위해 코드를 리뷰하는 에이전트는 여러분이 지켜보든 그렇지 않든 동일한 검사를 수행합니다.²

핵심 요점

후크는 실행을 보장하지만, 프롬프트는 그렇지 않습니다. 린팅, 포매팅, 보안 검사, 그리고 모델 동작과 무관하게 매번 반드시 실행되어야 하는 모든 작업에는 후크를 사용하세요. 종료 코드 2는 동작을 차단합니다. 종료 코드 1은 경고만 발생시킵니다.³
Skills는 자동으로 활성화되는 도메인 전문성을 인코딩합니다. description 필드가 모든 것을 결정합니다. Claude는 skill을 언제 적용할지 판단할 때 키워드 매칭이 아니라 LLM 추론을 사용합니다.⁴
subagents는 컨텍스트 비대화를 방지합니다. 탐색과 분석을 위한 격리된 컨텍스트 윈도가 메인 세션을 가볍게 유지합니다. 독립적인 subagents는 병렬로 실행하고, 워커 간 지속적인 조율이 필요할 때는 에이전트 팀을 사용하세요.⁵
메모리는 파일시스템에 존재합니다. 파일은 컨텍스트 윈도를 넘어 보존됩니다. CLAUDE.md, MEMORY.md, rules 디렉터리, 그리고 핸드오프 문서가 구조화된 외부 메모리 시스템을 형성합니다.⁶
다중 에이전트 심의는 사각지대를 잡아냅니다. 단일 에이전트는 자신의 가정을 스스로 반박할 수 없습니다. 평가 우선순위가 서로 다른 두 개의 독립 에이전트는 품질 게이트가 다룰 수 없는 구조적 결함을 잡아냅니다.⁷
harness 패턴이 곧 시스템입니다. CLAUDE.md, 후크, skills, 에이전트, 메모리는 독립적인 기능이 아닙니다. 이들이 결합하여 여러분과 모델 사이의 결정론적 계층을 이루며, 자동화에 따라 함께 확장됩니다.

이 가이드 활용법

경험 수준	여기서 시작	그다음에 살펴볼 것
Claude Code를 매일 사용 중이며 더 깊이 파고 싶음	The Harness Pattern	Skills System, Hook Architecture
자율 워크플로 구축	Subagent Patterns	Multi-Agent Orchestration, Production Patterns
에이전트 아키텍처 평가	Why Agent Architecture Matters	Decision Framework, Security Considerations
팀 harness 구성	CLAUDE.md Design	Hook Architecture, Quick Reference Card

각 섹션은 이전 섹션 위에 쌓입니다. 마지막에 있는 Decision Framework는 문제 유형별로 적절한 메커니즘을 선택할 수 있는 조회 표를 제공합니다.

5분 안에 완성하는 골든 패스

깊이 있는 내용으로 들어가기 전에, 0에서 시작해 작동하는 harness를 구축하는 가장 짧은 경로를 소개합니다. hook 하나, skill 하나, subagent 하나, 그리고 하나의 결과물입니다.

1단계: 보안 hook 만들기 (2분)

.claude/hooks/block-secrets.sh 파일을 생성합니다.

#!/bin/bash
INPUT=$(cat)
CMD=$(echo "$INPUT" | jq -r '.tool_input.command // empty')
if echo "$CMD" | grep -qEi '(AKIA|sk-|ghp_|password=)'; then
    echo "BLOCKED: Potential secret in command" >&2
    exit 2
fi

.claude/settings.json에 연결합니다.

{
  "hooks": {
    "PreToolUse": [
      {
        "matcher": "Bash",
        "hooks": [{ "type": "command", "command": ".claude/hooks/block-secrets.sh" }]
      }
    ]
  }
}

결과: 이제 Claude가 실행하는 모든 bash 명령은 유출된 자격 증명이 있는지 검사됩니다. 모델은 이 검사를 건너뛸 수 없습니다.

2단계: 코드 리뷰 skill 만들기 (1분)

.claude/skills/reviewer/SKILL.md 파일을 생성하고 frontmatter(name: reviewer, description: Review code for security issues, bugs, and quality problems. Use when examining changes, reviewing PRs, or auditing code., allowed-tools: Read, Grep, Glob)와 함께 체크리스트를 작성합니다. SQL 인젝션, XSS, 하드코딩된 시크릿, 누락된 에러 처리, 50줄이 넘는 함수.

결과: Claude는 리뷰, 검사, 또는 감사를 언급할 때마다 이 전문성을 자동으로 활성화합니다.

3단계: subagent 생성하기 (30초)

아무 Claude Code 세션에서 Claude에게 별도의 에이전트를 사용하여 최근 커밋 3개를 보안 이슈 관점에서 리뷰해달라고 요청하세요. Claude는 diff를 읽고, 여러분의 리뷰 skill을 적용하고, 요약을 반환하는 Explore 에이전트를 생성합니다. 메인 컨텍스트는 깨끗하게 유지됩니다.

이제 무엇을 얻었는가

3계층 harness를 갖추게 되었습니다. 결정론적 보안 게이트(hook), 자동으로 활성화되는 도메인 전문성(skill), 그리고 컨텍스트를 보호하는 격리된 분석(subagent). 아래의 모든 섹션은 이 세 계층 중 하나를 확장한 내용입니다.

에이전트 아키텍처가 중요한 이유

Simon Willison은 현재의 순간을 하나의 관찰로 규정합니다. 이제 코드를 작성하는 것은 싸졌다는 것입니다.⁸ 맞는 말입니다. 하지만 그 따름정리는 이제 검증이 비싼 부분이 되었다는 것입니다. 검증 인프라 없이 만들어진 저렴한 코드는 대규모로 버그를 양산합니다. 결실을 맺는 투자는 더 나은 프롬프트가 아닙니다. 모델이 놓치는 것을 잡아내는, 모델을 둘러싼 시스템입니다.

에이전트 아키텍처를 필수적으로 만드는 세 가지 힘이 있습니다.

컨텍스트 윈도우는 유한하고 손실이 있습니다. 모든 파일 읽기, 도구 출력, 대화 턴은 토큰을 소비합니다. Microsoft Research와 Salesforce는 200,000개 이상의 시뮬레이션된 대화에서 15개의 LLM를 테스트했고, 단일 턴에서 다중 턴 상호작용으로 넘어갈 때 평균 39%의 성능 저하를 발견했습니다.⁹ 이 저하는 단 두 턴만에 시작되며 예측 가능한 곡선을 따릅니다. 처음 30분 동안의 정밀한 다중 파일 편집이 90분 무렵에는 단일 파일 터널 비전으로 전락합니다. 더 긴 컨텍스트 윈도우로는 이 문제를 해결할 수 없습니다. 동일한 연구의 “Concat” 조건(전체 대화를 단일 프롬프트로 제공)은 같은 내용으로 단일 턴 성능의 95.1%를 달성했습니다. 저하는 토큰 제한이 아니라 턴 경계에서 발생합니다.

모델의 동작은 결정론적이 아니라 확률적입니다. Claude에게 “파일을 편집한 후 항상 Prettier를 실행하라”고 지시하면 대략 80%의 경우에만 작동합니다.³ 모델은 잊어버리거나, 속도를 우선시하거나, 변경이 “너무 작다”고 판단할 수 있습니다. 컴플라이언스, 보안, 팀 표준에서 80%는 허용되지 않습니다. hook은 실행을 보장합니다. 모든 Edit 또는 Write는 예외 없이 매번 여러분의 포매터를 트리거합니다. 결정론은 확률론을 이깁니다.

단일 관점은 다차원적 문제를 놓칩니다. API 엔드포인트를 리뷰한 단일 에이전트는 인증을 확인하고, 입력 정화를 검증하고, CORS 헤더를 확인했습니다. 깨끗한 건강 진단서가 나왔습니다. 별도로 침투 테스터로 프롬프트된 두 번째 에이전트는 해당 엔드포인트가 데이터베이스 쿼리 증폭을 통해 서비스 거부를 유발할 수 있는 무제한 쿼리 매개변수를 받아들인다는 것을 발견했습니다.⁷ 첫 번째 에이전트는 평가 프레임워크에서 쿼리 복잡성을 보안 표면으로 취급하지 않았기 때문에 확인하지 않았습니다. 이 간극은 구조적입니다. 어떤 수준의 프롬프트 엔지니어링으로도 해결되지 않습니다.

에이전트 아키텍처는 이 세 가지 모두를 다룹니다. hook은 결정론적 제약을 강제하고, subagent는 컨텍스트 격리를 관리하며, 다중 에이전트 오케스트레이션은 독립적인 관점을 제공합니다. 이들이 함께 harness를 구성합니다.

하네스 패턴

하네스는 프레임워크가 아닙니다. 패턴입니다. AI 코딩 에이전트를 결정론적 인프라로 감싸는 파일, 스크립트, 컨벤션의 조합 가능한 집합입니다. 구성 요소는 다음과 같습니다.

┌──────────────────────────────────────────────────────────────┐
│                      THE HARNESS PATTERN                      │
├──────────────────────────────────────────────────────────────┤
│  ORCHESTRATION                                                │
│  ┌────────────┐  ┌────────────┐  ┌────────────┐             │
│  │   Agent     │  │   Agent    │  │  Consensus │             │
│  │   Teams     │  │  Spawning  │  │  Validation│             │
│  └────────────┘  └────────────┘  └────────────┘             │
│  Multi-agent deliberation, parallel research, voting          │
├──────────────────────────────────────────────────────────────┤
│  EXTENSION LAYER                                              │
│  ┌──────────┐  ┌──────────┐  ┌──────────┐  ┌──────────┐    │
│  │  Skills   │  │  Hooks   │  │  Memory  │  │  Agents  │    │
│  └──────────┘  └──────────┘  └──────────┘  └──────────┘    │
│  Domain expertise, deterministic gates, persistent state,     │
│  specialized subagents                                        │
├──────────────────────────────────────────────────────────────┤
│  INSTRUCTION LAYER                                            │
│  ┌──────────────────────────────────────────────────────┐    │
│  │     CLAUDE.md  +  .claude/rules/  +  MEMORY.md       │    │
│  └──────────────────────────────────────────────────────┘    │
│  Project context, operational policy, cross-session memory    │
├──────────────────────────────────────────────────────────────┤
│  CORE LAYER                                                   │
│  ┌──────────────────────────────────────────────────────┐    │
│  │           Main Conversation Context (LLM)             │    │
│  └──────────────────────────────────────────────────────┘    │
│  Your primary interaction; finite context; costs money        │
└──────────────────────────────────────────────────────────────┘

Instruction Layer: CLAUDE.md 파일과 rules 디렉터리는 에이전트가 프로젝트에 대해 알고 있는 내용을 정의합니다. 세션 시작 시점과 모든 압축(compaction) 이후에 자동으로 로드됩니다. 이것이 에이전트의 장기 아키텍처 기억입니다.

Extension Layer: skills는 컨텍스트에 따라 자동으로 활성화되는 도메인 전문성을 제공합니다. hooks는 일치하는 모든 도구 호출에서 발동되는 결정론적 게이트를 제공합니다. 메모리 파일은 세션 간에 상태를 유지합니다. 커스텀 agents는 특화된 subagents 구성을 제공합니다.

Orchestration Layer: 멀티 에이전트 패턴은 독립적인 에이전트들을 조율하여 리서치, 리뷰, 숙고를 수행합니다. 스폰 예산은 폭주 재귀를 방지합니다. 합의 검증은 품질을 보장합니다.

핵심 통찰은 다음과 같습니다. 대부분의 사용자는 Core Layer에서만 작업하면서 컨텍스트가 부풀고 비용이 치솟는 것을 지켜봅니다. 파워 유저는 Instruction Layer와 Extension Layer를 구성한 다음, Core Layer는 오케스트레이션과 최종 의사결정에만 사용합니다.²

매니지드 vs. 셀프 호스팅 하네스 (2026년 4월)

2026년 초까지 “직접 하네스를 구축한다”는 경로가 사실상 유일한 선택지였습니다. 2026년 4월에 그 상황이 바뀌었습니다. Anthropic는 Claude Managed Agents를 퍼블릭 베타로 출시했고(4월 8일), 하네스 루프 + 도구 실행 + 샌드박스 컨테이너 + 상태 영속화를 REST API로 제공하며 표준 토큰 비용에 더해 세션-시간당 $0.08로 과금합니다. OpenAI의 Agents SDK 업데이트(4월 16일)는 동일한 분리를 공식화했습니다. 하네스와 컴퓨트를 별도 계층으로 두고, 네이티브 샌드박스 제공자(Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop, Vercel)와 컨테이너 손실에서 살아남기 위한 스냅샷/재수화(rehydrate) 기능을 갖췄습니다.²³²⁴

OpenAI 측의 더 깊은 SDK 표면은 openai-agents Python v0.14.0에 도입되었습니다(2026년 4월 15일 릴리스, 4월 16일 발표). Agent의 서브클래스인 SandboxAgent에는 default_manifest, 샌드박스 명령, capabilities가 포함됩니다. Manifest는 새 워크스페이스 계약(파일, 디렉터리, 로컬 파일, Git 저장소, 환경, 사용자, 마운트)을 기술합니다. SandboxRunConfig는 실행마다 샌드박스 클라이언트, 라이브 세션 주입, manifest 오버라이드, 스냅샷, 머터리얼라이제이션 동시성 한도를 연결합니다. 내장 capabilities는 셸 액세스, 파일시스템 편집, 이미지 검사, skills, 샌드박스 메모리, 압축을 포괄합니다. 샌드박스 메모리는 실행 간에 추출된 교훈을 영속화하고 점진적으로 노출합니다. 워크스페이스는 로컬 파일, Git 저장소 항목, 원격 마운트(S3, R2, GCS, Azure Blob, S3 Files)를 지원하며, 스냅샷은 제공자 간에 이식 가능합니다. 백엔드는 UnixLocalSandboxClient, DockerSandboxClient이며, Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop, Vercel용 호스티드 클라이언트는 옵셔널 extras로 제공됩니다.²⁴

Claude Code 런타임을 라이브러리로 임베드하고 싶은 Python 프로젝트의 경우 — claude 셸 호출과 Managed Agents에 대한 REST API 사이의 중간 지점 — claude-agent-sdk-python이 세 번째 옵션입니다. 4월 28-29일 시리즈(v0.1.69 → v0.1.71)는 번들된 CLI를 v2.1.123으로 올렸고, mcp 의존성의 하한을 >=1.19.0으로 끌어올렸으며(이전 버전은 인프로세스 MCP 도구의 CallToolResult 반환을 조용히 누락시켜 모델에 검증 오류 블롭만 남겼습니다), SandboxNetworkConfig를 TypeScript SDK와 스키마 동등성(allowedDomains, deniedDomains, allowManagedDomainsOnly, allowMachLookup)에 맞췄습니다.³⁰

이제 아키텍처적 분기가 실재합니다.

차원	셀프 호스팅 하네스 (이 가이드의 기본값)	매니지드 하네스 (Claude Managed Agents / OpenAI Agents SDK)
운영 부담	모든 것을 직접 운영	벤더가 루프, 샌드박스, 상태 운영
커스터마이징	완전 — 자체 hooks, 자체 skills, 자체 메모리	제한적 — 벤더가 정의한 확장 지점
비용 모델	토큰 + 셀프 호스팅 컴퓨트	토큰 + 런타임-시간 프리미엄
상태 영속성	직접 설계	벤더가 단절 구간 동안 체크포인트
에이전트 팀 오케스트레이션	직접 구축	벤더 제공 멀티 에이전트 조율

언제 무엇을 선택할 것인가: 셀프 호스팅은 이미 인프라 역량을 갖춘 팀, 직접 통제하는 skills/hooks를 원하는 팀, 특정 워크플로를 깊이 최적화하는 팀에게 여전히 적합합니다. 매니지드는 전담 플랫폼 엔지니어가 없는 팀, 커스터마이징보다 가치 실현 시간이 더 중요한 팀, 또는 영속성 계층을 직접 구축하지 않고도 노트북을 닫아도 에이전트 실행이 안정적으로 살아남아야 하는 경우에 적합합니다. 둘은 호환됩니다. 셀프 호스팅 하네스를 운영하면서 특정 장기 실행 작업을 그 REST API를 통해 Managed Agents에 위임할 수 있습니다.

디스크에서 하네스의 모습

~/.claude/
├── CLAUDE.md                    # Personal global instructions
├── settings.json                # User-level hooks and permissions
├── skills/                      # Personal skills (44+)
│   ├── code-reviewer/SKILL.md
│   ├── security-auditor/SKILL.md
│   └── api-designer/SKILL.md
├── agents/                      # Custom subagent definitions
│   ├── security-reviewer.md
│   └── code-explorer.md
├── rules/                       # Categorized rule files
│   ├── security.md
│   ├── testing.md
│   └── git-workflow.md
├── hooks/                       # Hook scripts
│   ├── validate-bash.sh
│   ├── auto-format.sh
│   └── recursion-guard.sh
├── configs/                     # JSON configuration
│   ├── recursion-limits.json
│   └── deliberation-config.json
├── state/                       # Runtime state
│   ├── recursion-depth.json
│   └── agent-lineage.json
├── handoffs/                    # Session handoff documents
│   └── deliberation-prd-7.md
└── projects/                    # Per-project memory
    └── {project}/memory/MEMORY.md

.claude/                         # Project-level (in repo)
├── CLAUDE.md                    # Project instructions
├── settings.json                # Project hooks
├── skills/                      # Team-shared skills
├── agents/                      # Team-shared agents
└── rules/                       # Project rules

이 구조의 모든 파일은 목적을 가집니다. ~/.claude/ 트리는 모든 프로젝트에 적용되는 개인 인프라입니다. 각 저장소의 .claude/ 트리는 프로젝트 전용이며 git을 통해 공유됩니다. 두 가지가 합쳐져 완전한 하네스를 이룹니다.

Skills 시스템

Skill은 모델이 호출하는 확장 기능입니다. Claude은 사용자가 명시적으로 호출하지 않아도 컨텍스트에 따라 자동으로 Skill을 발견하고 적용합니다.⁴ 세션마다 같은 컨텍스트를 다시 설명하고 있다는 사실을 깨닫는 순간이 바로 Skill을 만들어야 할 때입니다.

Skill을 만들어야 할 때

상황	만들 것	이유
매 세션마다 같은 체크리스트를 붙여 넣고 있다	Skill	자동으로 활성화되는 도메인 전문성
같은 명령어 시퀀스를 명시적으로 실행한다	슬래시 명령어	예측 가능한 트리거를 가진 사용자 호출 동작
컨텍스트를 오염시키지 않는 격리된 분석이 필요하다	Subagent	집중 작업을 위한 별도의 컨텍스트 윈도우
특정 지시사항이 포함된 일회성 프롬프트가 필요하다	만들지 않음	그냥 입력하세요. 모든 것이 추상화될 필요는 없습니다.

Skill은 Claude이 항상 사용할 수 있는 지식을 위한 것입니다. 슬래시 명령어는 사용자가 명시적으로 트리거하는 동작을 위한 것입니다. 둘 사이에서 결정해야 한다면 다음을 자문해 보세요. “Claude이 이를 자동으로 적용해야 하는가, 아니면 내가 언제 실행할지 결정해야 하는가?”

Skill 만들기

Skill은 범위가 가장 넓은 것부터 좁은 것까지 네 가지 위치에 존재할 수 있습니다.⁴

범위	위치	적용 대상
엔터프라이즈	관리형 설정	조직 내 모든 사용자
개인	`~/.claude/skills/<name>/SKILL.md`	모든 프로젝트
프로젝트	`.claude/skills/<name>/SKILL.md`	해당 프로젝트만
플러그인	`<plugin>/skills/<name>/SKILL.md`	플러그인이 활성화된 곳

모든 Skill에는 YAML frontmatter가 포함된 SKILL.md 파일이 필요합니다.

---
name: code-reviewer
description: Review code for security vulnerabilities, performance issues,
  and best practice violations. Use when examining code changes, reviewing
  PRs, analyzing code quality, or when asked to review, audit, or check code.
allowed-tools: Read, Grep, Glob
---

# Code Review Expertise

## Security Checks
When reviewing code, verify:

### Input Validation
- All user input sanitized before database operations
- Parameterized queries (no string interpolation in SQL)
- Output encoding for rendered HTML content

### Authentication
- Session tokens validated on every protected endpoint
- Permission checks before data mutations
- No hardcoded credentials or API keys in source

Frontmatter 레퍼런스

필드	필수 여부	용도
`name`	예	고유 식별자 (소문자, 하이픈, 최대 64자)
`description`	예	발견 트리거 (최대 1024자). Claude은 이를 사용해 Skill을 적용할 시점을 결정합니다
`allowed-tools`	아니오	Claude의 기능을 제한합니다 (예: 읽기 전용을 위한 `Read, Grep, Glob`)
`disable-model-invocation`	아니오	자동 활성화를 막습니다. Skill은 `/skill-name`을 통해서만 활성화됩니다
`user-invocable`	아니오	`false`로 설정하면 `/` 메뉴에서 완전히 숨깁니다
`model`	아니오	Skill이 활성화된 동안 사용할 모델을 재정의합니다
`context`	아니오	`fork`로 설정하면 격리된 컨텍스트 윈도우에서 실행합니다
`agent`	아니오	자체 격리된 컨텍스트를 가진 subagent로 실행합니다
`hooks`	아니오	이 Skill로 범위가 한정된 라이프사이클 훅을 정의합니다
`$ARGUMENTS`	아니오	문자열 치환: `/skill-name` 뒤에 입력한 사용자 입력으로 대체됩니다

Description 필드가 전부입니다

세션이 시작되면 Claude Code은 모든 Skill의 name과 description을 추출하여 Claude의 컨텍스트에 주입합니다. 사용자가 메시지를 보내면 Claude은 언어 모델 추론을 사용해 어떤 Skill이 관련 있는지 판단합니다. Claude Code 소스에 대한 독립적인 분석에서도 이 메커니즘이 확인됩니다. Skill 설명은 시스템 프롬프트의 available_skills 섹션에 주입되며, 모델은 표준 언어 이해 능력을 사용해 관련 Skill을 선택합니다.¹⁰

나쁜 description:

description: Helps with code

효과적인 description:

description: Review code for security vulnerabilities, performance issues,
  and best practice violations. Use when examining code changes, reviewing
  PRs, analyzing code quality, or when asked to review, audit, or check code.

효과적인 description에는 다음이 포함되어 있습니다. 무엇을 하는지 (특정 이슈 유형에 대한 코드 리뷰), 언제 사용하는지 (변경사항, PR, 품질 분석 검토), 그리고 사용자가 자연스럽게 입력하는 트리거 문구 (review, audit, check)입니다.

컨텍스트 예산

모든 Skill description은 컨텍스트 윈도우의 1%로 동적으로 확장되는 컨텍스트 예산을 공유하며, 폴백 값은 8,000자입니다.⁴ Skill이 많다면 각 description을 간결하게 유지하고 핵심 사용 사례를 앞쪽에 배치하세요. SLASH_COMMAND_TOOL_CHAR_BUDGET 환경 변수로 예산을 재정의할 수 있지만,¹¹ 더 나은 해결책은 더 짧고 정확한 description을 작성하는 것입니다. 세션 중에 /context를 실행하면 제외된 Skill이 있는지 확인할 수 있습니다.

보조 파일과 구성

Skill은 동일한 디렉터리의 추가 파일을 참조할 수 있습니다.

~/.claude/skills/code-reviewer/
├── SKILL.md                    # Required: frontmatter + core expertise
├── SECURITY_PATTERNS.md        # Referenced: detailed vulnerability patterns
└── PERFORMANCE_CHECKLIST.md    # Referenced: optimization guidelines

SKILL.md에서 상대 링크로 참조하세요. Claude은 Skill이 활성화될 때 필요에 따라 이 파일들을 읽습니다. SKILL.md는 500줄 이하로 유지하고, 자세한 참고 자료는 보조 파일로 옮기세요.¹²

Git을 통한 Skill 공유

프로젝트 Skill (저장소 루트의 .claude/skills/)은 버전 관리를 통해 공유됩니다.⁴

mkdir -p .claude/skills/domain-expert
# ... write SKILL.md ...
git add .claude/skills/
git commit -m "feat: add domain-expert skill for payment processing rules"
git push

팀원들이 pull하면 Skill을 자동으로 받게 됩니다. 설치도, 구성도 필요 없습니다. 이는 팀 전체에서 전문성을 표준화하는 가장 효과적인 방법입니다.

프롬프트 라이브러리로서의 Skill

단일 목적 Skill을 넘어, 디렉터리 구조 자체가 정리된 프롬프트 라이브러리로 작동합니다.

~/.claude/skills/
├── code-reviewer/          # Activates on: review, audit, check
├── api-designer/           # Activates on: design API, endpoint, schema
├── sql-analyst/            # Activates on: query, database, migration
├── deploy-checker/         # Activates on: deploy, release, production
└── incident-responder/     # Activates on: error, failure, outage, debug

각 Skill은 전문성의 서로 다른 측면을 담아냅니다. 이들이 모여 Claude이 컨텍스트에 따라 자동으로 끌어다 쓰는 지식 베이스를 형성합니다. 주니어 개발자도 요청 없이 시니어 수준의 안내를 받을 수 있습니다.

Skill은 Hook과 결합됩니다

Skill은 frontmatter에 자체 hook을 정의할 수 있으며, 이 hook은 Skill이 실행되는 동안에만 활성화됩니다. 이를 통해 다른 세션을 오염시키지 않는 도메인별 동작이 만들어집니다.²

---
name: deploy-checker
description: Verify deployment readiness. Use when preparing to deploy,
  release, or push to production.
hooks:
  PreToolUse:
    - matcher: Bash
      hooks:
        - type: command
          command: "bash -c 'INPUT=$(cat); CMD=$(echo \"$INPUT\" | jq -r \".tool_input.command\"); if echo \"$CMD\" | grep -qE \"deploy|release|publish\"; then echo \"DEPLOYMENT COMMAND DETECTED. Running pre-flight checks.\" >&2; fi'"
---

철학 Skill은 SessionStart hook을 통해 자동 활성화되어, 명시적 호출 없이도 모든 세션에 품질 제약 조건을 주입합니다. Skill 자체는 지식이고, hook은 강제력입니다. 둘이 합쳐져 정책 계층을 형성합니다.

흔한 Skill 실수

너무 광범위한 description. 모든 git 관련 프롬프트(rebase, merge, cherry-pick, 심지어 git status)에 활성화되는 git-rebase-helper Skill은 세션의 80%에서 컨텍스트를 오염시킵니다. 해결책은 description을 더 좁히거나, disable-model-invocation: true를 추가해 명시적인 /skill-name 호출을 요구하는 것입니다.⁴

예산을 두고 경쟁하는 너무 많은 Skill. Skill이 많아질수록 1% 컨텍스트 예산을 두고 경쟁하는 description도 늘어납니다. Skill이 활성화되지 않는 것 같다면 /context에서 제외된 항목이 있는지 확인하세요. 모호한 Skill 다수보다 잘 설명된 소수의 Skill을 우선시하세요.

보조 파일에 묻혀 있는 핵심 정보. Claude은 SKILL.md를 즉시 읽지만, 보조 파일은 필요할 때만 접근합니다. 핵심 정보가 보조 파일에 있다면 Claude이 찾지 못할 수도 있습니다. 필수 정보는 SKILL.md에 직접 넣으세요.⁴

SDK Skill 표면 (2026년 5월 8일)

claude-agent-sdk-python v0.1.77+ 기반의 자체 호스팅 harness는 사용 가능한 Skill을 선언할 때 allowed_tools의 레거시 "Skill" 값이 아니라 ClaudeAgentOptions의 skills 옵션을 사용해야 합니다.³⁷ "Skill" 단축 표기는 더 이상 권장되지 않으며, 전용 옵션은 어떤 Skill을 사용할 수 있는지에 대해 Claude Code에 더 구조화된 정보를 제공합니다. v0.1.77에 번들된 CLI는 v2.1.133입니다.

후크 아키텍처

후크는 Claude Code 라이프사이클 이벤트에 의해 트리거되는 셸 명령입니다.³ 후크는 LLM 외부에서 일반 스크립트로 실행되며, 모델이 해석하는 프롬프트가 아닙니다. 모델이 rm -rf /를 실행하고 싶어 한다면? 10줄짜리 bash 스크립트가 명령을 차단 목록과 대조하여 셸이 보기도 전에 거부합니다. 후크는 모델의 의도와 관계없이 발동됩니다.

사용 가능한 이벤트

이 가이드 업데이트 시점 기준으로 Claude Code는 8개 카테고리에 걸쳐 29개의 문서화된 라이프사이클 이벤트를 노출합니다. 이벤트 목록은 릴리스마다 늘어나므로 참조 문서를 단일 진실 공급원으로 취급하고, 프로덕션 후크를 연결하기 전에 치트 시트에서 현재 전체 표를 확인하세요:¹³

카테고리	이벤트	차단 가능?
세션	`SessionStart`, `Setup`, `SessionEnd`	불가
사용자 / 완료	`UserPromptSubmit`, `UserPromptExpansion`, `Stop`, `StopFailure`, `TeammateIdle`	프롬프트/확장/중지/유휴는 차단 가능; `StopFailure`는 불가
도구	`PreToolUse`, `PermissionRequest`, `PermissionDenied`, `PostToolUse`, `PostToolUseFailure`, `PostToolBatch`	사전/권한/배치는 차단 가능; 사후 이벤트는 불가
서브에이전트 / 작업	`SubagentStart`, `SubagentStop`, `TaskCreated`, `TaskCompleted`	중지/작업 이벤트는 차단 가능; 시작은 불가
컨텍스트	`PreCompact`, `PostCompact`, `InstructionsLoaded`	`PreCompact`은 차단 가능; 사후/로드는 불가
파일시스템 / 워크스페이스	`CwdChanged`, `FileChanged`, `WorktreeCreate`, `WorktreeRemove`	워크트리 생성은 차단 가능; 그 외는 불가
설정 / 알림	`ConfigChange`, `Notification`	정책 설정을 제외한 설정 변경은 차단 가능; 알림은 불가
MCP	`Elicitation`, `ElicitationResult`	가능

종료 코드 의미론

종료 코드는 후크가 작업을 차단할지 여부를 결정합니다:³

종료 코드	의미	동작
0	성공	작업이 진행됩니다. stdout은 verbose 모드에서 표시됩니다.
2	차단 오류	작업이 중단됩니다. stderr이 Claude에 전달되는 오류 메시지가 됩니다.
1, 3 등	비차단 오류	작업이 계속됩니다. stderr은 verbose 모드(Ctrl+O)에서만 표시됩니다.

중요: 모든 보안 후크는 exit 1이 아닌 exit 2를 사용해야 합니다. Exit 1은 비차단 경고입니다. 위험한 명령은 여전히 실행됩니다. 이는 팀 전반에서 가장 흔한 후크 실수입니다.¹⁴

후크 구성

후크는 설정 파일에 위치합니다. 공유 후크는 프로젝트 수준(.claude/settings.json)에, 개인 후크는 사용자 수준(~/.claude/settings.json)에 배치합니다:

{
  "hooks": {
    "PreToolUse": [
      {
        "matcher": "Bash",
        "hooks": [
          {
            "type": "command",
            "command": ".claude/hooks/validate-bash.sh"
          }
        ]
      }
    ],
    "PostToolUse": [
      {
        "matcher": "Write|Edit",
        "hooks": [
          {
            "type": "command",
            "command": "bash -c 'if [[ \"$FILE_PATH\" == *.py ]]; then black --quiet \"$FILE_PATH\" 2>/dev/null; fi'"
          }
        ]
      }
    ]
  }
}

matcher 필드는 이벤트별 값을 필터링합니다. 도구 이벤트의 경우 Bash, Edit, Write, Read, Glob, Grep과 같은 tool_name 값, mcp__server__tool 같은 MCP 도구 이름, 또는 모든 도구를 의미하는 *와 매칭됩니다. 단순 이름과 |로 구분된 목록은 정확히 일치하며, 다른 문자가 포함된 값은 JavaScript 정규 표현식으로 처리됩니다. 일부 이벤트는 매처를 지원하지 않으며 구성된 경우 항상 발동합니다.¹³

후크 입출력 프로토콜

후크는 stdin으로 전체 컨텍스트가 포함된 JSON을 받습니다:

{
  "tool_name": "Bash",
  "tool_input": {
    "command": "npm test",
    "description": "Run test suite"
  },
  "session_id": "abc-123",
  "agent_id": "main",
  "agent_type": "main"
}

고급 제어를 위해 PreToolUse 후크는 도구 입력을 수정하거나, 컨텍스트를 주입하거나, 권한 결정을 내리는 JSON을 출력할 수 있습니다. hookSpecificOutput 래퍼를 사용하세요 — 기존의 최상위 decision/reason 형식은 PreToolUse에서 더 이상 지원되지 않습니다:

{
  "hookSpecificOutput": {
    "hookEventName": "PreToolUse",
    "permissionDecision": "allow",
    "permissionDecisionReason": "Command validated and modified",
    "updatedInput": {
      "command": "npm test -- --coverage --ci"
    },
    "additionalContext": "Note: This database has a 5-second query timeout."
  }
}

세 가지 보장 유형

후크를 작성하기 전에 자문하세요: 어떤 종류의 보장이 필요한가?¹⁴

서식 보장은 사후에 일관성을 확보합니다. Write/Edit에 대한 PostToolUse 후크는 모든 파일 변경 후 포매터를 실행합니다. 포매터가 모든 것을 정규화하므로 모델의 출력은 중요하지 않습니다.

{
  "hooks": {
    "PostToolUse": [
      {
        "matcher": "Write|Edit",
        "hooks": [
          {
            "type": "command",
            "command": "bash -c 'if [[ \"$FILE_PATH\" == *.py ]]; then black --quiet \"$FILE_PATH\" 2>/dev/null; elif [[ \"$FILE_PATH\" == *.js ]] || [[ \"$FILE_PATH\" == *.ts ]]; then npx prettier --write \"$FILE_PATH\" 2>/dev/null; fi'"
          }
        ]
      }
    ]
  }
}

안전 보장은 위험한 작업이 실행되기 전에 차단합니다. Bash에 대한 PreToolUse 후크는 명령을 검사하고 종료 코드 2로 파괴적인 패턴을 차단합니다:

#!/bin/bash
# validate-bash.sh — block dangerous commands
INPUT=$(cat)
CMD=$(echo "$INPUT" | jq -r '.tool_input.command')

if echo "$CMD" | grep -qE "rm\s+-rf\s+/|git\s+push\s+(-f|--force)\s+(origin\s+)?main|git\s+reset\s+--hard|DROP\s+TABLE"; then
    echo "BLOCKED: Dangerous command detected: $CMD" >&2
    exit 2
fi

품질 보장은 결정 시점에 상태를 검증합니다. git commit 명령에 대한 PreToolUse 후크는 린터나 테스트 스위트를 실행하고 품질 검사가 실패하면 커밋을 차단합니다:

#!/bin/bash
# quality-gate.sh — lint before commit
INPUT=$(cat)
CMD=$(echo "$INPUT" | jq -r '.tool_input.command')

if echo "$CMD" | grep -qE "^git\s+commit"; then
    if ! LINT_OUTPUT=$(ruff check . --select E,F,W 2>&1); then
        echo "LINT FAILED -- fix before committing:" >&2
        echo "$LINT_OUTPUT" >&2
        exit 2
    fi
fi

셸 명령을 넘어선 후크 유형

Claude Code는 다섯 가지 후크 유형을 지원합니다:¹³

Command 후크(type: "command")는 셸 스크립트를 실행합니다. 빠르고 결정론적이며 토큰 비용이 없습니다.

MCP 도구 후크(type: "mcp_tool")는 이미 연결된 MCP 서버에서 도구를 호출합니다. 검증 로직이 이미 MCP 경계 너머에 존재하고 별도의 셸 스크립트가 필요하지 않을 때 사용하세요.

Prompt 후크(type: "prompt")는 빠른 Claude 모델에 단일 턴 프롬프트를 전송합니다. 모델은 허용 시 { "ok": true }를, 차단 시 { "ok": false, "reason": "..." }를 반환합니다. 정규식으로 표현할 수 없는 미묘한 평가에 사용하세요.

Agent 후크(type: "agent")는 다중 턴 검증을 위해 도구 접근(Read, Grep, Glob)을 갖춘 서브에이전트를 스폰합니다. 실험적이므로 프로덕션 게이트에는 command 후크를 선호하고, 실제 파일이나 테스트 출력을 검사해야 하는 검사에만 agent 후크를 사용하세요:

{
  "hooks": {
    "Stop": [
      {
        "hooks": [
          {
            "type": "agent",
            "prompt": "Verify all unit tests pass. Run the test suite and check results. $ARGUMENTS",
            "timeout": 120
          }
        ]
      }
    ]
  }
}

HTTP 후크(type: "http")는 이벤트의 JSON 입력을 POST 요청으로 URL에 전송하고 JSON을 받습니다. 웹훅, 외부 알림 서비스 또는 API 기반 검증(v2.1.63+)에 사용하세요. SessionStart 이벤트에서는 지원되지 않습니다:

{
  "hooks": {
    "PostToolUse": [
      {
        "hooks": [
          {
            "type": "http",
            "url": "https://your-webhook.example.com/hook",
            "headers": { "Authorization": "Bearer $WEBHOOK_TOKEN" },
            "allowedEnvVars": ["WEBHOOK_TOKEN"],
            "timeout": 10
          }
        ]
      }
    ]
  }
}

비동기 후크

후크는 실행을 차단하지 않고 백그라운드에서 실행될 수 있습니다. 알림이나 로깅 같은 비핵심 작업에는 async: true를 추가하세요:¹³

{
  "type": "command",
  "command": ".claude/hooks/notify-slack.sh",
  "async": true
}

알림, 텔레메트리, 백업에는 비동기를 사용하세요. 서식 지정, 검증 또는 다음 작업 전에 완료되어야 하는 작업에는 절대 비동기를 사용하지 마세요.

독립 후크보다 디스패처

같은 이벤트에 일곱 개의 후크가 모두 발동하고 각각 독립적으로 stdin을 읽으면 경쟁 조건이 발생합니다. 두 개의 후크가 동시에 같은 JSON 상태 파일에 쓰면 JSON이 잘립니다. 그 파일을 파싱하는 모든 다운스트림 후크가 깨집니다.²

해결책: 캐시된 stdin에서 후크를 순차적으로 실행하는 이벤트당 하나의 디스패처:

#!/bin/bash
# dispatcher.sh — run hooks sequentially with cached stdin
INPUT=$(cat)
HOOK_DIR="$HOME/.claude/hooks/pre-tool-use.d"

for hook in "$HOOK_DIR"/*.sh; do
    [ -x "$hook" ] || continue
    echo "$INPUT" | "$hook"
    EXIT_CODE=$?
    if [ "$EXIT_CODE" -eq 2 ]; then
        exit 2  # Propagate block
    fi
done

후크 디버깅

조용히 실패하는 후크를 디버깅하기 위한 다섯 가지 기법:¹⁴

스크립트를 독립적으로 테스트하세요. 샘플 JSON을 파이프하세요: echo '{"tool_input":{"command":"git commit -m test"}}' | bash your-hook.sh
디버그 출력에 stderr을 사용하세요. 종료 코드 2의 stderr은 오류 메시지로 Claude에 다시 전달됩니다. 비차단 stderr(exit 1, 3 등)은 verbose 모드(Ctrl+O)에서만 나타납니다.
jq 실패를 주의하세요. 잘못된 JSON 경로는 조용히 null을 반환합니다. 실제 도구 입력으로 jq 표현식을 테스트하세요.
종료 코드를 확인하세요. exit 1을 사용하는 PreToolUse 후크는 작동하는 것처럼 보이지만 강제력은 전혀 없습니다.
후크를 빠르게 유지하세요. 후크는 동기적으로 실행됩니다. 모든 후크를 2초 이내, 이상적으로는 500ms 이내로 유지하세요.

SDK 측 후크 이벤트 스트리밍

claude-agent-sdk-python(v0.1.74+, 2026년 5월 6일) 위에 구축된 자체 호스팅 하니스는 셸 스크립트 콜백을 거치지 않고 메시지 스트림에서 직접 후크 이벤트를 구독할 수 있습니다.³⁶ ClaudeAgentOptions에 include_hook_events=True를 설정하면 HookEventMessage 객체(PreToolUse, PostToolUse, Stop 등)가 어시스턴트 메시지 및 도구 결과와 동일한 이터레이터에서 yield됩니다. 이는 TypeScript SDK의 includeHookEvents 옵션을 반영합니다. 동일한 릴리스에서 번들 CLI가 v2.1.129로 업그레이드되었습니다.

이벤트 스트림 패턴은 하니스가 이미 Python에 있고 모델 출력과 동일한 제어 흐름에서 후크 신호를 원할 때 적합합니다. 셸 스크립트 후크 계약(종료 코드, stdin JSON, 디스패처)은 여러 도구를 조합하거나, Claude Code와 Codex 간에 후크를 공유하거나, 차단을 위한 종료 코드 의미론이 필요한 하니스에 여전히 올바른 답입니다.

Effort 및 세션 출처 (2026년 5월 7-8일)

Claude Code v2.1.132 및 v2.1.133의 두 가지 추가 사항은 후크와 서브프로세스에 실행 컨텍스트에 대한 더 나은 신호를 제공합니다:³⁸³⁹

후크 입력의 effort.level. 후크는 이제 tool_input 및 session_id를 전달하는 동일한 입력에서 effort.level JSON 필드를 받습니다. 동일한 값이 $CLAUDE_EFFORT 환경 변수로 내보내지므로 Bash 명령은 JSON을 파싱하지 않고도 읽을 수 있습니다. 이를 사용하여 노력 단계에 따라 후크 비용을 조정하세요: low에서는 비용이 많이 드는 검증을 건너뛰고, xhigh나 max에서는 전체 보안 게이트를 실행하세요.
Bash 서브프로세스의 CLAUDE_CODE_SESSION_ID 환경 변수. Bash 도구 서브프로세스는 이제 후크가 보는 것과 동일한 session_id 값을 CLAUDE_CODE_SESSION_ID로 노출하여 봅니다. 이는 세션별 상태를 로깅하지만 이전에는 서브프로세스 이벤트와 후크 이벤트를 연관시킬 수 없었던 도구의 출처 격차를 해소합니다.

두 신호 모두 코드 변경 없이 사용할 수 있습니다. 새 필드를 무시하는 기존 후크는 계속 작동합니다.

메모리와 컨텍스트

모든 AI 대화는 유한한 컨텍스트 윈도우 안에서 이루어집니다. 대화가 길어지면 시스템은 새로운 내용을 위한 공간을 확보하기 위해 이전 턴을 압축합니다. 이 압축은 손실이 발생합니다. 3번째 턴에 기록된 아키텍처 결정이 15번째 턴까지 살아남지 못할 수 있습니다.⁹

멀티턴 붕괴의 세 가지 메커니즘

MSR/Salesforce 연구는 세 가지 독립적인 메커니즘을 식별했으며, 각각 다른 개입이 필요합니다.⁹

메커니즘	발생하는 일	개입 방법
컨텍스트 압축	새로운 내용에 맞추기 위해 이전 정보가 폐기됨	파일시스템에 상태 체크포인트
추론 일관성 손실	모델이 여러 턴에 걸쳐 자신의 이전 결정과 모순됨	신선한 컨텍스트 반복(Ralph 루프)
조정 실패	여러 에이전트가 서로 다른 상태 스냅샷을 보유함	에이전트 간 공유 상태 프로토콜

전략 1: 메모리로서의 파일시스템

컨텍스트 경계를 넘어 가장 안정적인 메모리는 파일시스템에 존재합니다. Claude Code는 모든 세션 시작 시점과 모든 압축 이후에 CLAUDE.md와 메모리 파일을 읽습니다.⁶

~/.claude/
├── configs/           # 14 JSON configs (thresholds, rules, budgets)
│   ├── deliberation-config.json
│   ├── recursion-limits.json
│   └── consensus-profiles.json
├── hooks/             # 95 lifecycle event handlers
├── skills/            # 44 reusable knowledge modules
├── state/             # Runtime state (recursion depth, agent lineage)
├── handoffs/          # 49 multi-session context documents
├── docs/              # 40+ system documentation files
└── projects/          # Per-project memory directories
    └── {project}/memory/
        └── MEMORY.md  # Always loaded into context

MEMORY.md 파일은 세션 전반에 걸쳐 오류, 결정, 패턴을 기록합니다. bash에서 VAR이 0일 때 ((VAR++))이 set -e와 함께 실패한다는 사실을 발견하면, 이를 기록합니다. 세 번의 세션 이후 Python에서 비슷한 정수 엣지 케이스를 만났을 때, MEMORY.md 항목이 그 패턴을 표면화합니다.¹⁵

Auto Memory (v2.1.32+): Claude Code는 프로젝트 컨텍스트를 자동으로 기록하고 회상합니다. 작업하는 동안 Claude는 관찰 내용을 ~/.claude/projects/{project-path}/memory/MEMORY.md에 작성합니다. Auto memory는 세션 시작 시 첫 200줄을 시스템 프롬프트에 로드합니다. 간결하게 유지하고 자세한 노트는 별도의 주제 파일에 링크하세요.⁶

전략 2: 사전 예방적 압축

Claude Code의 /compact 명령은 대화를 요약하고 핵심 결정, 파일 내용, 작업 상태를 보존하면서 컨텍스트 공간을 확보합니다.¹⁵

압축 시점: - 별개의 하위 작업을 완료한 후 (기능 구현, 버그 수정) - 코드베이스의 새로운 영역을 시작하기 전 - Claude가 반복하기 시작하거나 이전 컨텍스트를 잊어버릴 때 - 집중 세션 중 약 25-30분마다

CLAUDE.md의 사용자 지정 압축 지침:

# Summary Instructions
When using compact, focus on:
- Recent code changes
- Test results
- Architecture decisions made this session

전략 3: 세션 핸드오프

여러 세션에 걸친 작업의 경우, 전체 상태를 포착하는 핸드오프 문서를 작성합니다.

## Handoff: Deliberation Infrastructure PRD-7
**Status:** Hook wiring complete, 81 Python unit tests passing
**Files changed:** hooks/post-deliberation.sh, hooks/deliberation-pride-check.sh
**Decision:** Placed post-deliberation in PostToolUse:Task, pride-check in Stop
**Blocked:** Spawn budget model needs inheritance instead of depth increment
**Next:** PRD-8 integration tests in tests/test_deliberation_lib.py

Status/Files/Decision/Blocked/Next 구조는 후속 세션에 최소한의 토큰 비용으로 전체 컨텍스트를 제공합니다. claude -c (continue)로 새 세션을 시작하거나 핸드오프 문서를 읽으면 곧바로 구현으로 진입합니다.¹⁵

전략 4: 신선한 컨텍스트 반복(Ralph 루프)

60-90분을 초과하는 세션의 경우, 반복마다 새로운 Claude 인스턴스를 생성합니다. 상태는 대화 메모리가 아닌 파일시스템을 통해 지속됩니다. 각 반복은 전체 컨텍스트 예산을 받습니다.¹⁶

Iteration 1: [200K tokens] -> writes code, creates files, updates state
Iteration 2: [200K tokens] -> reads state from disk, continues
Iteration 3: [200K tokens] -> reads updated state, continues
...
Iteration N: [200K tokens] -> reads final state, verifies criteria

단일 장기 세션과 비교해 보세요.

Minute 0:   [200K tokens available] -> productive
Minute 30:  [150K tokens available] -> somewhat productive
Minute 60:  [100K tokens available] -> degraded
Minute 90:  [50K tokens available]  -> significantly degraded
Minute 120: [compressed, lossy]     -> errors accumulate

반복마다 신선한 컨텍스트를 사용하는 접근법은 방향 설정 단계(상태 파일 읽기, git 이력 스캔)에 15-20%의 오버헤드를 감수하는 대신 반복마다 완전한 인지 자원을 확보합니다.¹⁶ 비용-편익 계산은 다음과 같습니다. 60분 미만 세션의 경우 단일 대화가 더 효율적입니다. 90분을 넘어서면, 신선한 컨텍스트는 오버헤드에도 불구하고 더 높은 품질의 결과물을 만들어냅니다.

전략 5: 관리형 메모리 큐레이션(Dreaming)

Anthropic의 Claude Managed Agents는 2026년 5월 6일 Research Preview로 Dreaming을 추가했습니다.³⁵ Anthropic의 설명에 따르면 “Dreaming은 에이전트 세션과 메모리 저장소를 검토하고, 패턴을 추출하며, 메모리를 큐레이션하여 시간이 지남에 따라 에이전트가 개선되도록 하는 예약된 프로세스”입니다.³⁵

Dreaming은 세션 사이에 백그라운드에서 실행되며, 크리티컬 패스 위에 있지 않습니다. 이는 메모리로서의 파일시스템 패턴을 대체하기보다는 보완합니다. MEMORY.md 파일은 여전히 핵심 표면으로 남아 있고, Dreaming은 큐레이션된 메모리 항목을 Managed Agents 메모리 저장소에 작성하며, 에이전트는 세션 시작 시 이를 읽습니다. 두 패턴은 자체 호스팅 파일시스템 상태와 관리형 측 큐레이션을 혼합하는 harness에 공존합니다.

	파일시스템 메모리	Dreaming (Managed)
메모리가 위치하는 곳	사용자의 저장소, 버전 관리됨	Anthropic가 관리하는 메모리 저장소
언제 업데이트되는가	직접 또는 hooks를 통해 항목을 작성	세션 사이의 백그라운드 프로세스
무엇을 포착하는가	사용자가 표시한 결정, 오류, 패턴	세션 이력에서 추출된 패턴
가장 적합한 용도	프로젝트별 제도적 지식	손으로는 포착하지 못할 세션 간 패턴 발견

Dreaming은 Research Preview 단계이므로 동작이 변경될 수 있습니다. 위에 문서화된 세션 핸드오프와 CLAUDE.md 패턴은 자체 호스팅 harness의 권위 있는 메모리 메커니즘으로 남아 있습니다.

안티 패턴

10줄만 필요할 때 전체 파일 읽기. 2,000줄짜리 파일 한 번 읽기는 15,000-20,000 토큰을 소비합니다. 라인 오프셋을 사용하세요. Read file.py offset=100 limit=20은 그 비용의 대부분을 절약합니다.¹⁵

컨텍스트에 장황한 오류 출력 유지. 버그를 디버깅한 후, 컨텍스트는 실패한 반복에서 나온 40개 이상의 스택 트레이스를 보유하고 있습니다. 버그를 수정한 후 한 번의 /compact로 그 죽은 무게를 해제합니다.

모든 세션을 모든 파일 읽기로 시작. Claude Code의 glob과 grep 도구가 필요할 때 관련 파일을 찾도록 두면, 불필요한 사전 로딩으로 인한 100,000개 이상의 토큰을 절약합니다.¹⁵

서브에이전트 패턴

서브에이전트는 복잡한 작업을 독립적으로 처리하는 특수한 Claude 인스턴스입니다. 깨끗한 컨텍스트(메인 대화의 오염 없음)에서 시작하여 지정된 도구로 작동하고 결과를 요약 형태로 반환합니다. 탐색 결과가 메인 대화를 부풀리지 않고 결론만 반환됩니다.⁵

내장 서브에이전트 유형

유형	모델	모드	도구	사용처
Explore	Haiku (fast)	읽기 전용	Glob, Grep, Read, safe bash	코드베이스 탐색, 파일 찾기
General-purpose	상속	전체 읽기/쓰기	사용 가능한 모든 도구	복잡한 조사 + 수정
Plan	상속 (또는 Opus)	읽기 전용	Read, Glob, Grep, Bash	실행 전 계획 수립

커스텀 서브에이전트 생성

서브에이전트는 .claude/agents/(프로젝트) 또는 ~/.claude/agents/(개인)에 정의합니다.

---
name: security-reviewer
description: Expert security code reviewer. Use PROACTIVELY after any code
  changes to authentication, authorization, or data handling.
tools: Read, Grep, Glob, Bash
model: opus
permissionMode: plan
---

You are a senior security engineer reviewing code for vulnerabilities.

When invoked:
1. Identify the files that were recently changed
2. Analyze for OWASP Top 10 vulnerabilities
3. Check for secrets, hardcoded credentials, SQL injection
4. Report findings with severity levels and remediation steps

Focus on actionable security findings, not style issues.

서브에이전트 설정 필드

필드	필수	용도
`name`	예	고유 식별자 (소문자 + 하이픈)
`description`	예	호출 시점 (자동 위임을 유도하려면 “PROACTIVELY” 포함)
`tools`	아니오	쉼표로 구분. 생략 시 모든 도구를 상속받습니다. `Agent(agent_type)`을 지원하여 스폰 가능한 에이전트를 제한할 수 있습니다
`disallowedTools`	아니오	거부할 도구. 상속되거나 지정된 목록에서 제거됩니다
`model`	아니오	`sonnet`, `opus`, `haiku`, `inherit` (기본값: `inherit`)
`permissionMode`	아니오	`default`, `acceptEdits`, `delegate`, `dontAsk`, `bypassPermissions`, `plan`
`maxTurns`	아니오	서브에이전트가 중단되기 전 최대 에이전트 턴 수
`memory`	아니오	영구 메모리 범위: `user`, `project`, `local`
`skills`	아니오	시작 시 서브에이전트 컨텍스트에 skill 내용을 자동 로드합니다. v2.1.133부터 서브에이전트도 부모 세션과 동일한 방식으로 `Skill` 도구를 통해 프로젝트, 사용자, 플러그인 skills를 발견합니다. 이전 버전에서는 이러한 항목이 서브에이전트 컨텍스트에서 조용히 누락되었습니다.³⁹
`hooks`	아니오	이 서브에이전트의 실행 범위로 한정된 라이프사이클 hooks
`background`	아니오	항상 백그라운드 작업으로 실행
`isolation`	아니오	격리된 git worktree 복사본을 사용하려면 `worktree`로 설정

Worktree 격리

서브에이전트는 임시 git worktree에서 작동할 수 있으며, 이는 저장소의 완전히 격리된 복사본을 제공합니다.⁵

---
name: experimental-refactor
description: Attempt risky refactoring in isolation
isolation: worktree
tools: Read, Write, Edit, Bash, Grep, Glob
---

You have an isolated copy of the repository. Make changes freely.
If the refactoring succeeds, the changes can be merged back.
If it fails, the worktree is discarded with no impact on the main branch.

Worktree 격리는 코드베이스를 망가뜨릴 수 있는 실험적 작업에 필수적입니다.

병렬 서브에이전트

서로 조율할 필요가 없는 독립적인 조사 작업에는 병렬 서브에이전트를 사용하세요.⁵

> Have three explore agents search in parallel:
> 1. Authentication code
> 2. Database models
> 3. API routes

각 에이전트는 자체 컨텍스트 윈도우에서 실행되어 관련 코드를 찾고 요약을 반환합니다. 메인 컨텍스트는 깨끗하게 유지됩니다.

재귀 가드

스폰 한도가 없으면 에이전트가 에이전트에게 위임하고, 그 에이전트가 다시 다른 에이전트에게 위임하는 식으로 이어져, 매번 컨텍스트를 잃고 토큰을 소모합니다. 재귀 가드 패턴은 예산을 강제로 적용합니다.¹⁶

#!/bin/bash
# recursion-guard.sh — enforce spawn budget
CONFIG_FILE="${HOME}/.claude/configs/recursion-limits.json"
STATE_FILE="${HOME}/.claude/state/recursion-depth.json"

MAX_DEPTH=2
MAX_CHILDREN=5
DELIB_SPAWN_BUDGET=2
DELIB_MAX_AGENTS=12

# Read current depth
current_depth=$(jq -r '.depth // 0' "$STATE_FILE" 2>/dev/null)

if [[ "$current_depth" -ge "$MAX_DEPTH" ]]; then
    echo "BLOCKED: Maximum recursion depth ($MAX_DEPTH) reached" >&2
    exit 2
fi

# Increment depth using safe arithmetic (not ((VAR++)) with set -e)
new_depth=$((current_depth + 1))
jq --argjson d "$new_depth" '.depth = $d' "$STATE_FILE" > "${STATE_FILE}.tmp"
mv "${STATE_FILE}.tmp" "$STATE_FILE"

핵심 교훈: 깊이 한도만이 아니라 스폰 예산을 사용하세요. 깊이 기반 한도는 부모-자식 체인을 추적하지만(깊이 3에서 차단) 폭은 놓칩니다. 깊이 1에 23개의 에이전트가 있어도 여전히 “깊이 1”입니다. 스폰 예산은 부모당 활성 자식의 총 수를 추적하며, 설정 가능한 최댓값으로 제한됩니다. 예산 모델은 프록시 지표(중첩 레벨이 너무 많음)가 아닌 실제 실패 모드(전체 에이전트가 너무 많음)에 매핑됩니다.⁷

Agent Teams (리서치 프리뷰)

Agent Teams는 독립적으로 작업하는 여러 Claude Code 인스턴스를 조율합니다. 이들은 공유 메일박스와 작업 목록을 통해 통신하고 서로의 결과에 이의를 제기할 수 있습니다.⁵

구성 요소	역할
Team lead	팀을 만들고, 팀원을 스폰하며, 작업을 조율하는 메인 세션
Teammates	할당된 작업을 수행하는 별개의 Claude Code 인스턴스
Task list	팀원이 클레임하고 완료하는 공유 작업 항목 (파일 락 적용)
Mailbox	에이전트 간 통신을 위한 메시징 시스템

활성화 방법: export CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1

서브에이전트 vs Agent Teams 사용 시점:

	서브에이전트	Agent Teams
통신	결과만 보고	팀원이 서로 직접 메시지 전송
조율	메인 에이전트가 모든 작업 관리	자체 조율되는 공유 작업 목록
최적 용도	결과만 중요한 집중된 작업	토론과 협업이 필요한 복잡한 작업
토큰 비용	더 낮음	더 높음 (각 팀원 = 별도 컨텍스트 윈도우)

멀티 에이전트 오케스트레이션

단일 에이전트 AI 시스템은 구조적 사각지대를 가지고 있습니다. 자신의 가정에 이의를 제기할 수 없다는 점입니다.⁷ 멀티 에이전트 심의는 결정이 확정되기 전에 여러 관점에서 독립적으로 평가하도록 강제합니다.

크로스 툴 오케스트레이션(2026년 4월): Google은 4월 7일 Scion을 오픈소스로 공개했습니다. Claude Code, Gemini CLI 및 기타 “deep agents”를 동시 프로세스로 실행하는 멀티 에이전트 하이퍼바이저로, 각각 격리된 컨테이너, git worktree, 자격 증명을 가집니다. 로컬, 허브 또는 Kubernetes에서 실행됩니다. 명시적인 철학은 “제약보다 격리”입니다. 에이전트는 프롬프트가 아닌 인프라 계층에서 강제되는 경계 내부에서 높은 자율성으로 실행됩니다.²⁵ 이는 서로 다른 도구 벤더에 걸쳐 subagent 격리 논거를 직접 확장합니다. 워크플로가 Claude와 OpenAI 모델에 걸쳐 있다면, Scion은 에이전트별 worktree + 자격 증명 격리를 갖춘 크로스 툴 subagent의 첫 번째 실제 레퍼런스 구현입니다.

토론은 만능 해법이 아닙니다: M3MAD-Bench 연구 클러스터(2026년 초)는 멀티 에이전트 토론이 정체될 수 있고 잘못된 합의에 의해 전복될 수 있음을 발견했습니다. 다른 에이전트가 자신 있게 잘못된 답변을 주장할 때 유효한 논거가 패배합니다.²⁶ Tool-MAD는 각 에이전트에게 이질적인 도구 접근 권한을 부여하고 판정 단계에서 Faithfulness/Relevance 점수를 사용함으로써 이를 개선합니다. 토론 스타일 오케스트레이션을 구축한다면 (a) 에이전트별 도구 이질성과 (b) 정량적 판정 점수에 투자하세요. 더 많은 에이전트 = 더 나은 답변이라고 가정하지 마세요.

매니지드 멀티 에이전트 오케스트레이션 및 Outcomes(Public Beta)

아래에서 설명하는 심의 인프라를 직접 구축하고 싶지 않다면, Multiagent Orchestration이 2026년 5월 6일에 Claude Managed Agents에서 Public Beta로 출시되었습니다.³⁵ Anthropic에 따르면: “단일 에이전트가 잘 처리하기에 작업이 너무 많을 때, 멀티 에이전트 오케스트레이션을 통해 lead agent가 작업을 여러 부분으로 나누고 각각을 자체 모델, 프롬프트, 도구를 갖춘 specialist에게 위임할 수 있습니다.”³⁵ Specialist들은 “공유 파일시스템에서 병렬로 작업하며 lead agent의 전체 컨텍스트에 기여합니다.”³⁵

추적(tracing)은 기본 제공됩니다. Anthropic에 따르면: “Claude Console에서 모든 단계를 추적할 수 있습니다. 어떤 에이전트가 무엇을, 어떤 순서로, 왜 했는지를 보여주어 작업이 어떻게 위임되고 실행되었는지에 대한 완전한 가시성을 제공합니다.”³⁵

함께 출시된 Public Beta 기능은 Outcomes입니다. Anthropic에 따르면: “성공이 어떤 모습인지를 설명하는 루브릭을 작성하면 에이전트가 그것을 향해 작업합니다. 별도의 grader가 자체 컨텍스트 윈도우에서 출력을 기준에 따라 평가하므로 에이전트의 추론에 영향을 받지 않습니다.”³⁵ 이는 이 섹션 후반부에 문서화된 두 게이트 검증 패턴의 매니지드 서비스 버전입니다. 루브릭이 직접 작성한 게이트를 대체하고, 별도의 grader가 합의 검증자를 대체합니다.

	자체 호스팅 심의(이 섹션)	Managed Multiagent + Outcomes
Specialist 라우팅	spawn 로직을 직접 작성	Lead agent가 작업을 여러 부분으로 분할
검증	두 게이트 hook + 합의 점수	별도 컨텍스트의 루브릭 + grader
추적	직접 계측	Claude Console
적합한 경우	완전한 제어 또는 특정 도구 구성이 필요한 패턴	검증 루브릭이 계약인 표준 위임 패턴
가격	토큰 + harness 비용만	표준 토큰에 Managed Agents 세션 시간 요금 추가(4월 8일 출시 기준; ²³ 참조)

검증이 자체 hook 표면(PreToolUse 차단, exit-code 시맨틱, 커스텀 dispatcher)과 통합되어야 하거나 harness가 외부 종속성 없이 실행되어야 하는 경우 자체 호스팅 심의가 올바른 답입니다. 표준 위임과 루브릭 채점이 실제로 필요한 계약일 때는 Managed Multiagent가 올바른 답입니다.

최소 실행 가능 심의(Minimum Viable Deliberation)

2개의 에이전트와 1개의 규칙으로 시작하세요. 에이전트는 서로의 작업을 보기 전에 독립적으로 평가해야 합니다.⁷

Decision arrives
  |
  v
Confidence check: is this risky, ambiguous, or irreversible?
  |
  +-- NO  -> Single agent decides (normal flow)
  |
  +-- YES -> Spawn 2 agents with different system prompts
             Agent A: "Argue FOR this approach"
             Agent B: "Argue AGAINST this approach"
             |
             v
             Compare findings
             |
             +-- Agreement with different reasoning -> Proceed
             +-- Genuine disagreement -> Investigate the conflict
             +-- Agreement with same reasoning -> Suspect herding

이 패턴이 가치의 80%를 커버합니다. 나머지는 점진적인 개선을 추가할 뿐입니다.

신뢰도 트리거(The Confidence Trigger)

모든 작업에 심의가 필요한 것은 아닙니다. 신뢰도 점수 모듈은 네 가지 차원을 평가합니다.¹⁷

모호성 - 쿼리에 여러 가지 유효한 해석이 존재하는가?
도메인 복잡성 - 전문 지식이 필요한가?
이해관계 - 결정이 되돌릴 수 있는가?
컨텍스트 의존성 - 더 넓은 시스템에 대한 이해가 필요한가?

점수는 세 가지 수준에 매핑됩니다.

수준	임계값	조치
HIGH	0.85+	심의 없이 진행
MEDIUM	0.70-0.84	신뢰도 노트를 기록하고 진행
LOW	0.70 미만	전체 멀티 에이전트 심의 트리거

임계값은 작업 유형에 따라 적응합니다. 보안 결정은 0.85 합의가 필요합니다. 문서 변경은 0.50만 필요합니다. 이는 단순한 작업의 과잉 엔지니어링을 방지하면서 위험한 결정에 대해서는 면밀한 검토가 이루어지도록 보장합니다.⁷

상태 머신(The State Machine)

7개 단계가 각각 이전 단계에 의해 게이팅됩니다.⁷

IDLE -> RESEARCH -> DELIBERATION -> RANKING -> PRD_GENERATION -> COMPLETE
                                                                    |
                                                              (or FAILED)

RESEARCH: 독립적인 에이전트가 주제를 조사합니다. 각 에이전트는 서로 다른 페르소나(Technical Architect, Security Analyst, Performance Engineer 등)를 받습니다. 컨텍스트 격리는 연구 중 에이전트가 서로의 발견을 볼 수 없도록 보장합니다.

DELIBERATION: 에이전트는 모든 연구 발견을 보고 대안을 생성합니다. Debate agent는 충돌을 식별합니다. Synthesis agent는 모순되지 않는 발견을 결합합니다.

RANKING: 각 에이전트는 5개의 가중 차원에 걸쳐 제안된 모든 접근 방식을 점수화합니다.

차원	가중치
Impact	0.25
Quality	0.25
Feasibility	0.20
Reusability	0.15
Risk	0.15

두 게이트 검증 아키텍처(Two-Gate Validation Architecture)

두 개의 검증 게이트가 서로 다른 단계에서 문제를 포착합니다.⁷

Gate 1: 합의 검증(PostToolUse hook). 각 심의 에이전트가 완료된 직후에 실행됩니다. 1. Phase가 최소 RANKING에 도달해야 함 2. 최소 2개의 에이전트 완료(구성 가능) 3. 합의 점수가 작업 적응형 임계값을 충족 4. 어떤 에이전트라도 반대했다면, 우려 사항이 문서화되어야 함

Gate 2: Pride Check(Stop hook). 세션이 종료되기 전에 실행됩니다. 1. 다양한 방법: 여러 고유 페르소나가 대표됨 2. 모순 투명성: 반대 의견에 문서화된 이유가 있음 3. 복잡성 처리: 최소 2개의 대안이 생성됨 4. 합의 신뢰도: strong(0.85 초과) 또는 moderate(0.70-0.84)로 분류됨 5. 개선 증거: 최종 신뢰도가 초기 신뢰도를 초과함

서로 다른 라이프사이클 시점의 두 hook은 실패가 실제로 발생하는 방식과 일치합니다. 어떤 실패는 즉각적이고(낮은 점수) 어떤 실패는 점진적입니다(낮은 다양성, 누락된 반대 의견 문서화).⁷

합의가 위험한 이유

Charlan Nemeth는 1986년부터 2018년 저서 In Defense of Troublemakers에 이르기까지 소수 의견 반대를 연구했습니다. 반대자가 있는 그룹은 빠른 합의에 도달하는 그룹보다 더 나은 결정을 내립니다. 반대자가 옳을 필요는 없습니다. 반대 행위 자체가 다수가 그렇지 않으면 건너뛸 가정을 검토하도록 강제합니다.¹⁸

Wu et al.은 LLM 에이전트가 진정으로 토론할 수 있는지 테스트했고, 의견 불일치에 대한 구조적 인센티브가 없으면 에이전트가 정확성과 무관하게 가장 자신감 있게 들리는 초기 응답으로 수렴한다는 사실을 발견했습니다.¹⁹ Liang et al.은 근본 원인을 “Degeneration-of-Thought”로 식별했습니다. LLM이 한 입장에 대한 신뢰를 확립하면 자기 성찰만으로는 새로운 반론을 생성할 수 없으며, 이로 인해 멀티 에이전트 평가가 구조적으로 필요하게 됩니다.²⁰

독립성이 핵심 설계 제약입니다. 서로의 발견을 볼 수 있는 두 에이전트가 동일한 배포 전략을 평가할 때 0.45와 0.48 점수를 산출했습니다. 가시성 없는 동일한 에이전트는 0.45와 0.72를 산출했습니다. 0.48과 0.72의 차이가 herding(군집 행동)의 비용입니다.⁷

가짜 합의 감지

순응 감지 모듈은 에이전트가 진정한 평가 없이 동의하고 있음을 시사하는 패턴을 추적합니다.⁷

점수 클러스터링: 모든 에이전트가 10점 척도에서 0.3점 이내로 점수를 매기는 것은 독립적인 평가가 아닌 공유된 컨텍스트 오염을 시사합니다. 인증 리팩터링을 평가하는 5개 에이전트가 모두 보안 리스크를 7.1과 7.4 사이로 점수 매겼을 때, 새로운 컨텍스트 격리로 다시 실행하니 점수가 5.8-8.9로 분산되었습니다.

상투적 반대: 에이전트가 독립적인 반대 의견을 생성하는 대신 서로의 우려 사항 언어를 복사합니다.

소수 관점의 부재: 우선순위가 충돌하는 페르소나(Security Analyst와 Performance Engineer는 모든 사안에 동의하는 경우가 드뭅니다)로부터의 만장일치 승인.

순응 감지기는 명백한 사례(에이전트가 너무 빨리 수렴하는 심의의 약 10-15%)를 포착합니다. 나머지 85-90%에 대해서는 합의 게이트와 pride check 게이트가 충분한 검증을 제공합니다.

심의에서 효과가 없었던 것

자유 형식 토론 라운드. 데이터베이스 인덱싱 논의에 대한 세 라운드의 주고받는 텍스트는 7,500 토큰의 토론을 생성했습니다. 라운드 1: 진정한 의견 불일치. 라운드 2: 입장 재진술. 라운드 3: 다른 단어로 동일한 논거. 구조화된 차원 점수화가 자유 형식 토론을 대체하여 비용을 60% 줄이는 동시에 랭킹 품질을 개선했습니다.⁷

단일 검증 게이트. 첫 번째 구현은 세션 종료 시 하나의 검증 hook을 실행했습니다. 한 에이전트가 0.52 합의 점수(임계값 미만)로 심의를 완료하고 세션 종료 hook이 실패를 표시하기 전 20분 동안 관련 없는 작업을 계속했습니다. 두 게이트로 분할(작업 완료 시 하나, 세션 종료 시 하나)함으로써 동일한 문제를 서로 다른 라이프사이클 시점에서 포착했습니다.⁷

심의 비용

각 연구 에이전트는 약 5,000 토큰의 컨텍스트를 처리하고 2,000-3,000 토큰의 발견 사항을 생성합니다. 3개 에이전트 기준 결정당 추가 15,000-24,000 토큰입니다. 10개 에이전트 기준 약 50,000-80,000 토큰입니다.⁷

현재 Opus 가격으로 3-에이전트 심의 비용은 약 $0.68-0.90입니다. 10-에이전트 심의 비용은 $2.25-3.00입니다. 이 시스템은 결정의 약 10%에 대해 심의를 트리거하므로 모든 결정에 걸친 분할 상환 비용은 세션당 $0.23-0.30입니다. 그것이 가치 있는지는 잘못된 결정의 비용이 얼마인지에 달려 있습니다.

심의해야 할 때

심의	건너뛰기
보안 아키텍처	문서 오타
데이터베이스 스키마 설계	변수 이름 변경
API 계약 변경	로그 메시지 업데이트
배포 전략	주석 재작성
의존성 업그레이드	테스트 픽스처 업데이트

CLAUDE.md 설계

CLAUDE.md는 사람을 위한 README가 아니라 AI 에이전트를 위한 운영 정책입니다.²¹ 에이전트는 여러분이 왜 conventional commits를 사용하는지 이해할 필요가 없습니다. 에이전트에게 필요한 것은 실행할 정확한 명령과 “완료”의 모습이 어떤 것인지입니다.

우선순위 계층 구조

위치	범위	공유	사용 사례
Enterprise managed settings	조직	모든 사용자	회사 표준
`./CLAUDE.md` 또는 `./.claude/CLAUDE.md`	프로젝트	git을 통해	팀 컨텍스트
`~/.claude/CLAUDE.md`	사용자	모든 프로젝트	개인 설정
`./CLAUDE.local.md`	프로젝트 로컬	공유 안 함	개인 프로젝트 메모
`.claude/rules/*.md`	프로젝트 규칙	git을 통해	카테고리별 정책
`~/.claude/rules/*.md`	사용자 규칙	모든 프로젝트	개인 정책

규칙 파일은 자동으로 로드되며 CLAUDE.md를 어지럽히지 않으면서 구조화된 컨텍스트를 제공합니다.⁶

무시되는 것들

다음 패턴은 에이전트의 동작에 관찰 가능한 변화를 거의 일으키지 않습니다.²¹

명령어가 없는 산문 단락. “우리는 깨끗하고 잘 테스트된 코드를 중요하게 여깁니다”는 문서화이지 운영 지침이 아닙니다. 에이전트는 이를 읽고도 실행 가능한 지시가 없기 때문에 테스트 없이 코드를 작성하게 됩니다.

모호한 지시. “데이터베이스 마이그레이션에 주의하세요”는 제약이 아닙니다. “마이그레이션을 적용하기 전에 alembic check를 실행하세요. 다운그레이드 경로가 없으면 중단하세요.”가 제약입니다.

모순된 우선순위. “빠르게 움직이고 신속하게 출시하라” + “포괄적인 테스트 커버리지를 보장하라” + “런타임을 5분 이내로 유지하라” + “모든 커밋 전에 전체 통합 테스트를 실행하라”. 에이전트는 이 네 가지를 동시에 만족시킬 수 없으며, 결국 검증을 건너뛰는 쪽으로 기본 동작합니다.²¹

시행 수단이 없는 스타일 가이드. ruff check --select D 없이 “Google Python Style Guide를 따르라”고 하면 에이전트는 준수 여부를 검증할 방법이 없습니다.

효과가 있는 것들

명령어 우선 지시:

## Build and Test Commands
- Install: `pip install -r requirements.txt`
- Lint: `ruff check . --fix`
- Format: `ruff format .`
- Test: `pytest -v --tb=short`
- Type check: `mypy app/ --strict`
- Full verify: `ruff check . && ruff format --check . && pytest -v`

종료 조건 정의:

## Definition of Done
A task is complete when ALL of the following pass:
1. `ruff check .` exits 0
2. `pytest -v` exits 0 with no failures
3. `mypy app/ --strict` exits 0
4. Changed files have been staged and committed
5. Commit message follows conventional format: `type(scope): description`

작업별로 구성된 섹션:

## When Writing Code
- Run `ruff check .` after every file change
- Add type hints to all new functions

## When Reviewing Code
- Check for security issues: `bandit -r app/`
- Verify test coverage: `pytest --cov=app --cov-fail-under=80`

## When Releasing
- Update version in `pyproject.toml`
- Run full suite: `pytest -v && ruff check . && mypy app/`

에스컬레이션 규칙:

## When Blocked
- If tests fail after 3 attempts: stop and report the failing test with full output
- If a dependency is missing: check `requirements.txt` first, then ask
- Never: delete files to resolve errors, force push, or skip tests

작성 순서

처음부터 시작한다면 다음 우선순위 순으로 섹션을 추가하세요.²¹

빌드 및 테스트 명령어 (에이전트가 유용한 작업을 하기 전에 반드시 필요)
완료 정의 (잘못된 완료 보고를 방지)
에스컬레이션 규칙 (파괴적인 우회 방법을 방지)
작업별로 구성된 섹션 (관련 없는 지시를 파싱하는 것을 줄임)
디렉터리 범위 지정 (모노레포의 경우, 서비스별 지시를 격리)

처음 네 가지가 작동하기 전까지는 스타일 선호 사항은 건너뛰세요.

파일 임포트

CLAUDE.md 안에서 다른 파일을 참조할 수 있습니다.

See @README.md for project overview
Coding standards: @docs/STYLE_GUIDE.md
API documentation: @docs/API.md
Personal preferences: @~/.claude/preferences.md

임포트 구문: 상대 경로(@docs/file.md), 절대 경로(@/absolute/path.md), 또는 홈 디렉터리(@~/.claude/file.md). 최대 깊이는 임포트 5단계입니다.⁶

도구 간 지시 호환성

AGENTS.md는 모든 주요 AI 코딩 도구가 인식하는 개방형 표준입니다.²¹ 팀에서 여러 도구를 사용한다면, AGENTS.md를 정식 소스로 작성하고 관련 섹션을 도구별 파일로 미러링하세요.

도구	네이티브 파일	AGENTS.md를 읽는가?
Codex CLI	AGENTS.md	Yes (네이티브)
Cursor	`.cursor/rules`	Yes (네이티브)
GitHub Copilot	`.github/copilot-instructions.md`	Yes (네이티브)
Amp	AGENTS.md	Yes (네이티브)
Windsurf	`.windsurfrules`	Yes (네이티브)
Claude Code	CLAUDE.md	No (별도 형식)

AGENTS.md의 패턴(명령어 우선, 종료 조건 정의, 작업별 구성)은 도구와 관계없이 어떤 지시 파일에서도 동작합니다. 서로 어긋나는 병렬 지시 세트를 유지하지 마세요. 권위 있는 단일 소스를 작성하고 미러링하세요.

Codex 호환성 메모

Codex는 이제 주요 하니스 계층에 대한 일급 등가물을 갖추고 있지만, 마이그레이션은 단순한 파일 복사가 아니라 패턴 번역입니다. Codex는 작업 시작 전에 AGENTS.md를 읽으며, ~/.codex의 전역 가이드를 프로젝트 및 중첩된 리포지토리 지시와 함께 계층화합니다.³¹ Codex 스킬은 점진적 공개 방식의 동일한 SKILL.md 멘탈 모델을 사용합니다. Codex는 스킬 이름, 설명, 파일 경로로 시작한 후 사용 결정을 내릴 때만 전체 스킬을 로드합니다.³² Codex는 또한 네이티브 훅, 플러그인 번들 훅, 관리형 훅, MCP 지원, 명시적 서브에이전트 워크플로를 갖추고 있습니다.³³³⁴

실용적 매핑:

Claude Code 하니스 계층	Codex 등가물	마이그레이션 규칙
`CLAUDE.md` / `.claude/rules/`	`AGENTS.md` / 중첩된 `AGENTS.override.md`	명령어와 완료 규칙은 정식으로 유지하고, 디렉터리 범위가 진정으로 다를 때만 분할
`.claude/skills/<name>/SKILL.md`	`.agents/skills/<name>/SKILL.md` 또는 플러그인 스킬	재사용 가능한 워크플로는 포팅하되, Codex의 활성화 표현과 예산에 맞게 설명을 다시 작성
`.claude/settings.json` 훅	Codex `config.toml`, 플러그인 훅, 또는 관리형 요구 사항 훅	결정론적 게이트를 먼저 포팅하고, 광범위하게 활성화하기 전에 실제 도구 이벤트로 각 훅을 테스트
`.claude/agents/*.md`	`~/.codex/agents/.toml`, `.codex/agents/.toml`, 또는 내장 `worker` / `explorer`	반복적으로 가치를 발휘하는 에이전트만 포팅. Codex 서브에이전트는 명시적이므로 명시적 위임을 선호
플러그인	Codex 플러그인	로컬 훅과 스킬이 검증된 후에 플러그인을 배포 단위로 사용

중요한 차이점: Claude 서브에이전트는 설명을 통해 자동으로 선택될 수 있지만, Codex는 현재 서브에이전트 워크플로를 명시적으로 문서화합니다. 따라서 Codex에서는 항상 켜져 있는 하니스 동작에는 스킬과 훅이 적절한 기본값이며, 서브에이전트는 의도적인 병렬 작업, 리뷰, 탐색을 위한 것입니다.

지시 사항 테스트

에이전트가 실제로 여러분의 지시를 읽고 따르는지 확인하세요.

# Check active instructions
claude --print "What instructions are you following for this project?"

# Verify specific rules are active
claude --print "What is your definition of done?"

산성 테스트: 에이전트에게 빌드 명령을 설명해 보라고 요청하세요. 명령을 그대로 재현하지 못한다면, 지시가 너무 장황하거나(내용이 컨텍스트 밖으로 밀려남), 너무 모호하거나(에이전트가 실행 가능한 지시를 추출하지 못함), 발견되지 않고 있는 것입니다. GitHub가 2,500개 리포지토리를 분석한 결과, 모호함이 대부분의 실패 원인이었습니다.²¹

프로덕션 패턴

Opus 4.7 장기 작업 패턴 (April 2026)

Claude Opus 4.7 (April 16, 2026)은 하니스가 방어해야 할 대상을 바꾸는 특정 기능들과 함께 출시되었습니다:²⁹

도구 실패 복원력: Opus 4.7은 Opus 4.6 세션을 멈추게 했던 도구 실패 상황에서도 작업을 계속합니다. 서브에이전트 코드의 방어적 재시도 래퍼를 줄일 수 있지만 — 완전히 제거할 수는 없습니다. 훅 수준의 가드는 유지하고, 프롬프트 내의 “도구가 실패하면 세 번 재시도하세요” 같은 스캐폴딩은 정리하세요.
xhigh 노력 등급 (Opus-4.7 전용): high와 max 사이에 위치합니다. 코딩 및 에이전트 워크로드의 권장 기본값입니다. 장기 실행 서브에이전트에서 xhigh는 비례 이하의 토큰 비용으로 high보다 의미 있는 성능 향상을 보입니다. max는 단발성 어려운 추론에 여전히 적합한 선택이며, xhigh는 지속적인 작업에 더 좋습니다.
토큰 예산 상한: 에이전트 실행마다 output_config.task_budget (베타 헤더 task-budgets-2026-03-13)을 통해 구성 가능합니다. 모델은 실행 중인 카운트다운을 보고 예기치 않게 소진되는 대신 작업을 예산에 맞춰 우아하게 조정합니다. 짧은 프롬프트에서 품질을 희생하지 않으면서 예측 가능한 토큰 지출을 원하는 에이전트 루프에 사용하세요.
암묵적 요구 인식: “암묵적 요구” 테스트를 통과한 최초의 Claude 모델 — 사용자의 문자 그대로의 요청이 실제로 필요한 것을 충분히 명시하지 않을 때를 인식합니다. 이로 인해 CLAUDE.md의 “명확화 규칙” 섹션이 덜 필요해집니다. CLAUDE.md가 “사용자가 Y를 요청할 때 X도 고려하라”는 가드레일 200줄로 되어 있다면, 이제 네이티브로 다뤄지는 항목들을 정리하세요.

워크트리 베이스, 샌드박스 경로, 관리자 설정 (May 7, 2026)

Claude Code v2.1.133은 프로덕션 하니스에서 알아둘 가치가 있는 4가지 관리자 등급 설정을 추가합니다:³⁹

설정	값	동작
`worktree.baseRef`	`fresh` (기본값) \| `head`	새 워크트리는 다시 `origin/<default>`에서 분기됩니다. v2.1.128에서의 기본값 변경 되돌림으로, 이전에는 로컬 `HEAD`를 사용했습니다. 팀이 새 워크트리에서 푸시되지 않은 커밋을 사용할 수 있어야 한다면 `worktree.baseRef: "head"`로 설정하세요.
`sandbox.bwrapPath`	절대 경로	`$PATH`에 없거나 벤더링된 버전을 배포하는 Linux/WSL 호스트에서 Bubblewrap 바이너리 위치를 고정합니다.
`sandbox.socatPath`	절대 경로	샌드박스 네트워킹에서 사용하는 `socat` 바이너리에 대해 동일한 개념입니다.
`parentSettingsBehavior`	`'first-wins'` (기본값) \| `'merge'`	SDK `managedSettings`가 상위 엔터프라이즈/팀 설정과 어떻게 결합되는지에 대한 관리자 등급 제어. `'merge'`는 자식 세션이 상속받고 확장하도록 하며, `'first-wins'`는 부모를 권위 있게 유지합니다.

worktree.baseRef 되돌림은 사용자에게 알려야 할 사항입니다: v2.1.128-v2.1.132 동작(로컬 HEAD에서 분기되는 워크트리)에 의존했던 에이전트는 명시적으로 다시 옵트인하지 않으면 새 워크트리에서 푸시되지 않은 작업에 접근할 수 없습니다.

품질 루프

모든 비사소한 변경에 대한 필수 리뷰 프로세스입니다:

구현(Implement) - 코드를 작성합니다
리뷰(Review) - 모든 줄을 다시 읽습니다. 오타, 논리 오류, 불명확한 부분을 잡아냅니다
평가(Evaluate) - evidence gate를 실행합니다. 패턴, 엣지 케이스, 테스트 커버리지를 확인합니다
개선(Refine) - 모든 문제를 수정합니다. 절대 “나중에”로 미루지 마세요
확장(Zoom Out) - 통합 지점, 임포트, 인접 코드의 회귀를 확인합니다
반복(Repeat) - evidence gate 기준 중 하나라도 실패하면 4단계로 돌아갑니다
보고(Report) - 무엇이 변경되었는지, 어떻게 검증했는지 나열하고 구체적인 증거를 인용합니다

Evidence Gate

“믿어요”와 “그럴 거예요”는 증거가 아닙니다. 파일 경로, 테스트 출력, 또는 구체적인 코드를 인용하세요.

기준	필수 증거
코드베이스 패턴을 따름	패턴 이름과 그것이 존재하는 파일을 명시
가장 단순한 작동 솔루션	어떤 더 단순한 대안이 거부되었으며 왜 그런지 설명
엣지 케이스 처리됨	구체적인 엣지 케이스와 각각이 어떻게 처리되는지 나열
테스트 통과	0 실패를 보여주는 테스트 출력을 붙여넣기
회귀 없음	확인한 파일/기능 이름 명시
실제 문제를 해결함	사용자의 요구사항과 이것이 어떻게 해결하는지 명시

어떤 행에 대해서도 증거를 만들 수 없다면 Refine으로 돌아가세요.²²

오류 처리 패턴

원자적 파일 쓰기. 여러 에이전트가 동일한 상태 파일에 동시에 쓰면 JSON이 손상됩니다. .tmp 파일에 쓴 다음 mv로 원자적으로 이동시키세요. OS는 동일한 파일시스템에서 mv가 원자적임을 보장합니다.¹⁷

# Atomic state update
jq --argjson d "$new_depth" '.depth = $d' "$STATE_FILE" > "${STATE_FILE}.tmp"
mv "${STATE_FILE}.tmp" "$STATE_FILE"

상태 손상 복구. 상태가 손상되면, 복구 패턴은 충돌하는 대신 안전한 기본값에서 다시 생성합니다:¹⁶

if ! jq -e '.depth' "$RECURSION_STATE_FILE" &>/dev/null; then
    # Corrupted state file, recreate with safe defaults
    echo '{"depth": 0, "agent_id": "root", "parent_id": null}' > "$RECURSION_STATE_FILE"
    echo "- Recursion state recovered (was corrupted)"
fi

((VAR++)) 배시 함정. ((VAR++))는 VAR이 0일 때 종료 코드 1을 반환합니다. 왜냐하면 0++는 0으로 평가되고, 배시는 이를 거짓으로 취급하기 때문입니다. set -e가 활성화되면 이는 스크립트를 종료시킵니다. 대신 VAR=$((VAR + 1))을 사용하세요.¹⁶

Blast Radius 분류

모든 에이전트 동작을 blast radius로 분류하고 그에 따라 게이트를 적용하세요:²

분류	예시	게이트
Local	파일 쓰기, 테스트 실행, 린팅	자동 승인
Shared	Git 커밋, 브랜치 생성	경고 후 진행
External	Git 푸시, API 호출, 배포	사람의 승인 필요

Remote Control(어떤 브라우저나 모바일 앱에서든 로컬 Claude Code에 연결)은 “External” 게이트를 차단 대기에서 비동기 알림으로 바꿉니다. 에이전트는 폰에서 이전 작업을 검토하는 동안 다음 작업을 계속 수행합니다.²

자율 실행을 위한 작업 명세

효과적인 자율 작업에는 세 가지 요소가 포함됩니다: 목적, 완료 기준, 컨텍스트 포인터.¹⁶

OBJECTIVE: Implement multi-agent deliberation with consensus validation.

COMPLETION CRITERIA:
- All tests in tests/test_deliberation_lib.py pass (81 tests)
- post-deliberation.sh validates consensus above 70% threshold
- recursion-guard.sh enforces spawn budget (max 12 agents)
- No Python type errors (mypy clean)

CONTEXT:
- Follow patterns in lib/deliberation/state_machine.py
- Consensus thresholds in configs/deliberation-config.json
- Spawn budget model: agents inherit budget, not increment depth

기준은 기계로 검증 가능해야 합니다: 테스트 통과/실패, 린터 출력, HTTP 상태 코드, 파일 존재 확인. 에이전트에게 “통과하는 테스트를 작성하라”고 요청한 초기 작업은 assert True와 assert 1 == 1을 만들어냈습니다. 기술적으로는 정확합니다. 실용적으로는 무가치합니다.¹⁶

기준 품질	예시	결과
모호함	“테스트 통과”	에이전트가 사소한 테스트를 작성함
측정 가능하지만 불완전	“테스트 통과 AND 커버리지 >80%”	테스트가 줄을 커버하지만 의미 있는 것을 테스트하지 않음
포괄적	“모든 테스트 통과 AND 커버리지 >80% AND 타입 오류 없음 AND 린터 통과 AND 각 테스트 클래스가 별개의 모듈을 테스트”	프로덕션 품질 출력

주의해야 할 실패 모드

실패 모드	설명	예방
Shortcut Spiral	더 빨리 끝내기 위해 품질 루프 단계를 건너뜀	evidence gate가 각 기준에 대한 증거를 요구함
Confidence Mirage	검증 실행 없이 “확신합니다”	완료 보고서에서 머뭇거리는 표현 금지
Phantom Verification	이번 세션에서 실행하지 않고 테스트 통과를 주장	Stop hook이 독립적으로 테스트 실행
Deferred Debt	커밋된 코드의 TODO/FIXME/HACK	git commit의 PreToolUse 훅이 diff를 스캔
Filesystem Pollution	중단된 반복으로부터의 막다른 아티팩트	완료 기준의 정리 단계

구체적인 세션 추적

5개 스토리가 있는 PRD를 처리하는 자율 실행의 세션 추적입니다:²

SessionStart 발화. 디스패처가 주입합니다: 현재 날짜, 프로젝트 감지, 철학 제약, 비용 추적 초기화. 5개 훅, 총 180ms.
에이전트가 PRD를 읽고 첫 번째 스토리를 계획합니다. UserPromptSubmit이 발화합니다. 디스패처가 주입합니다: 활성 프로젝트 컨텍스트, 세션 드리프트 베이스라인.
에이전트가 Bash를 호출하여 테스트를 실행합니다. PreToolUse:Bash가 발화합니다. 자격 증명 확인, 샌드박스 검증, 프로젝트 감지. 90ms. 테스트 실행. PostToolUse:Bash 발화: 활동 하트비트 기록, 드리프트 확인.
에이전트가 Write를 호출하여 파일을 생성합니다. PreToolUse:Write가 발화합니다: 파일 범위 확인. PostToolUse:Write가 발화합니다: 린트 확인, 커밋 추적.
에이전트가 스토리를 완료합니다. Stop이 발화합니다. 품질 게이트 확인: 에이전트가 증거를 인용했는가? 머뭇거리는 표현? diff에 TODO 코멘트? 어떤 검사라도 실패하면 종료 2가 발생하고 에이전트가 계속됩니다.
독립 검증: 새로운 에이전트가 이전 에이전트의 자체 보고를 신뢰하지 않고 테스트 스위트를 실행합니다.
세 개의 코드 리뷰 에이전트가 병렬로 생성됩니다. 각각이 diff를 독립적으로 검토합니다. 어떤 리뷰어든 CRITICAL을 표시하면, 스토리는 큐로 돌아갑니다.
스토리가 통과합니다. 다음 스토리가 로드됩니다. 5개 스토리 모두에 대해 사이클이 반복됩니다.

5개 스토리에 걸쳐 발화된 총 훅: 약 340. 훅에 소요된 총 시간: 약 12초. 그 오버헤드는 단일 야간 실행에서 세 건의 자격 증명 유출, 한 건의 파괴적인 명령, 두 건의 불완전한 구현을 막았습니다.

사례 연구: 야간 PRD 처리

프로덕션 하니스가 8개의 야간 세션에 걸쳐 12개의 PRD(47개 스토리)를 처리했습니다. 메트릭은 첫 4개 PRD(최소 하니스: CLAUDE.md만)와 마지막 8개(전체 하니스: 훅, 스킬, 품질 게이트, 다중 에이전트 리뷰)를 비교합니다.

메트릭	최소 (4 PRDs)	전체 하니스 (8 PRDs)	변화
자격 증명 유출	2건 git에 유출	7건 커밋 전 차단	사후 대응에서 예방으로
파괴적인 명령	1건 main 강제 푸시	4건 차단	Exit 2 적용
거짓 완료율	35% 테스트 실패	4%	evidence gate + Stop 훅
스토리당 수정 라운드	2.1	0.8	스킬 + 품질 루프
컨텍스트 저하	6건 발생	1건 발생	파일시스템 메모리
토큰 오버헤드	0%	약 3.2%	무시할 수준
스토리당 훅 시간	0s	약 2.4s	무시할 수준

두 건의 자격 증명 유출은 API 키 회전과 다운스트림 서비스 감사를 요구했습니다: 약 4시간의 사고 대응. 그에 상응하는 것을 막은 하니스 오버헤드는 스토리당 2.4초의 배시였습니다. Stop 훅이 에이전트가 완료를 보고하도록 허용하기 전에 독립적으로 테스트를 실행했기 때문에 거짓 완료율이 35%에서 4%로 떨어졌습니다.

보안 고려사항

신뢰할 수 있는 에이전트의 다섯 가지 원칙 (Anthropic, 2026년 4월)

Anthropic는 2026년 4월 9일 에이전트 신뢰성에 대한 공식 프레임워크를 발표했습니다.²⁷ 다섯 가지 원칙은 본 가이드의 Evidence Gate 사고방식과 평행을 이루며 이를 확장합니다:

원칙	의미	본 harness가 이를 충족하는 방법
인간 통제(Human control)	모든 결정 지점에서 의미 있는 인간 오버라이드	hooks가 도구 호출을 게이트; PreCompact 차단; check-layer로서의 Auto Mode 분류기
가치 정렬(Value alignment)	에이전트 행동이 인접한 목표가 아닌 사용자 의도를 추적	명시적 의도 명세로서의 CLAUDE.md; 능력 범위 지정으로서의 skills
보안(Security)	적대적 입력과 프롬프트 인젝션에 대한 저항	hook 계층에서 sandbox + 거부 규칙 + 입력 검증
투명성(Transparency)	결정과 행동에 대한 감사 가능한 기록	hook 로깅; 세션 트랜스크립트; skill 호출 추적
프라이버시(Privacy)	적절한 데이터 처리 및 거버넌스	자격 증명 환경 변수 스크러빙; hook 계층에서 시크릿 탐지

Anthropic는 또한 MCP를 Linux Foundation의 Agentic AI Foundation에 기증하여 AGENTS.md(현재 OpenAI, Google, Cursor, Factory, Sourcegraph와 공동으로 관리됨)에 합류시켰습니다. 에이전트 상호 운용성 표준은 이제 벤더 중립적입니다.²⁷

Skill 샌드박스 도구: skills를 공격 표면으로 취급하는 팀을 위해, Permiso의 SandyClaw(2026년 4월 2일 출시)는 skills를 전용 sandbox에서 실행하고 Sigma/YARA/Nova/Snort 탐지로부터 증거 기반 판정을 제공합니다. skill-sandbox 카테고리의 첫 번째 제품입니다.²⁸

Sandbox

Claude Code는 OS 수준 격리(macOS의 seatbelt, Linux의 bubblewrap)를 사용하여 네트워크 접근과 파일시스템 작업을 제한하는 선택적 sandbox 모드를 지원합니다(settings.json 또는 /sandbox 명령어를 통해 활성화). 활성화되면 sandbox는 모델이 임의의 네트워크 요청을 하거나 프로젝트 디렉터리 외부의 파일에 접근하는 것을 방지합니다. 샌드박싱이 없으면 Claude Code는 개별 도구 호출을 승인하거나 거부하는 권한 기반 모델을 사용합니다.¹³

권한 경계

권한 시스템은 여러 수준에서 작업을 게이팅합니다:

수준	제어 대상	예시
도구 권한	사용 가능한 도구	subagent를 Read, Grep, Glob으로 제한
파일 권한	수정 가능한 파일	`.env`, `credentials.json`에 대한 쓰기 차단
명령어 권한	실행 가능한 bash 명령어	`rm -rf`, `git push --force` 차단
네트워크 권한	접근 가능한 도메인	MCP 서버 연결을 위한 허용 목록

프롬프트 인젝션 방어

skills와 hooks는 프롬프트 인젝션에 대한 심층 방어를 제공합니다:

도구 제한이 있는 skills는 손상된 프롬프트가 쓰기 권한을 얻는 것을 방지합니다:

allowed-tools: Read, Grep, Glob

PreToolUse hooks는 모델이 어떻게 프롬프트되었든 모든 도구 호출을 검증합니다:

# Block credential file access regardless of prompt
if echo "$FILE_PATH" | grep -qE "\.(env|pem|key|credentials)$"; then
    echo "BLOCKED: Sensitive file access" >&2
    exit 2
fi

Subagent 격리는 폭발 반경을 제한합니다. permissionMode: plan을 가진 subagent는 프롬프트가 손상되더라도 변경을 가할 수 없습니다.

Hook 보안

환경 변수를 헤더에 보간하는 HTTP hooks는 임의의 환경 변수 유출을 방지하기 위해 명시적인 allowedEnvVars 목록을 요구합니다:¹³

{
  "type": "http",
  "url": "https://api.example.com/notify",
  "headers": {
    "Authorization": "Bearer $MY_TOKEN"
  },
  "allowedEnvVars": ["MY_TOKEN"]
}

인간-에이전트 책임 분담

에이전트 아키텍처에서의 보안은 인간과 에이전트 책임 사이의 명확한 분담을 요구합니다:¹⁷

인간의 책임	에이전트의 책임
문제 정의	파이프라인 실행
신뢰도 임계값	임계값 내 실행
합의 요구사항	합의 계산
품질 게이트 기준	품질 게이트 시행
오류 분석	오류 탐지
아키텍처 결정	아키텍처 옵션
도메인 컨텍스트 주입	문서 생성

패턴은 다음과 같습니다: 인간은 조직적 컨텍스트, 윤리적 판단 또는 전략적 방향을 요구하는 결정을 소유합니다. 에이전트는 큰 가능성 공간에 걸친 계산적 탐색을 요구하는 결정을 소유합니다. hooks가 그 경계를 시행합니다.

재귀적 hook 시행

Hooks는 subagent 행동에 대해서도 발동합니다.¹³ Claude가 Agent 도구를 통해 subagent를 생성하면, 여러분의 PreToolUse 및 PostToolUse hooks는 subagent가 사용하는 모든 도구에 대해 실행됩니다. 재귀적 hook 시행이 없으면 subagent가 안전 게이트를 우회할 수 있습니다. SubagentStop 이벤트를 사용하면 subagent가 완료될 때 정리 또는 검증을 실행할 수 있습니다.

이는 선택사항이 아닙니다. 보안 hooks 없이 subagent를 생성하는 에이전트는, 게이트가 메인 대화를 지켜보며 아무것도 하지 않는 동안, main에 강제 푸시하거나 자격 증명 파일을 읽거나 파괴적인 명령어를 실행할 수 있는 에이전트입니다.

아키텍처로서의 비용

비용은 운영상의 사후 고려가 아닌 아키텍처 결정입니다.² 세 가지 수준이 있습니다:

토큰 수준. 시스템 프롬프트 압축. 튜토리얼 코드 예제 제거(모델은 API를 알고 있습니다), 파일 전반에 걸친 중복 규칙 통합, 설명을 제약 조건으로 대체. “민감한 경로와 일치하는 도구 호출 거부”는 자격 증명을 읽지 말아야 하는 이유에 대한 15줄 설명과 동일한 작업을 수행합니다.

에이전트 수준. 긴 대화보다 새로운 spawn 사용. 자율 실행에서 각 스토리는 깨끗한 컨텍스트를 가진 새 에이전트를 받습니다. 각 에이전트가 새로 시작하므로 컨텍스트가 부풀어오르지 않습니다. 메모리 대신 브리핑: 모델은 30단계의 누적된 컨텍스트를 탐색하는 것보다 명확한 브리핑을 더 잘 실행합니다.

아키텍처 수준. 작업이 상태 비저장일 때 MCP보다 CLI 우선. 일회성 평가를 위한 claude --print 호출은 비용이 더 적게 들고 연결 오버헤드를 추가하지 않습니다. MCP는 도구가 영구적인 상태나 스트리밍이 필요할 때 의미가 있습니다.

의사결정 프레임워크

각 메커니즘을 사용해야 할 시점:

문제	사용	이유
모든 편집 후 코드 포맷팅	PostToolUse hook	매번 결정론적으로 발생해야 함
위험한 bash 명령어 차단	PreToolUse hook	실행 전에 차단해야 함, 종료 코드 2
보안 검토 패턴 적용	Skill	컨텍스트에 따라 자동 활성화되는 도메인 전문성
컨텍스트를 오염시키지 않고 코드베이스 탐색	Explore subagent	격리된 컨텍스트, 요약만 반환
실험적 리팩토링을 안전하게 실행	Worktree로 격리된 subagent	실패 시 변경 사항을 폐기 가능
다양한 관점에서 코드 검토	병렬 subagents 또는 Agent Team	독립적 평가가 사각지대를 방지
되돌릴 수 없는 아키텍처 결정	다중 에이전트 심의	신뢰도 트리거 + 합의 검증
세션 간 결정 영속화	MEMORY.md	파일시스템이 컨텍스트 경계를 넘어 유지됨
팀 표준 공유	프로젝트 CLAUDE.md + .claude/rules/	Git으로 배포, 자동 로드
프로젝트 빌드/테스트 명령어 정의	CLAUDE.md	에이전트가 검증할 수 있는 명령어 우선 지침
장기 자율 개발 실행	Ralph loop (새 컨텍스트 반복)	반복마다 전체 컨텍스트 예산, 파일시스템 상태
세션 종료 시 Slack 알림	비동기 Stop hook	비차단, 세션을 느리게 하지 않음
커밋 전 품질 검증	git commit에 대한 PreToolUse hook	lint/테스트 실패 시 커밋 차단
완료 기준 시행	Stop hook	작업 완료 전 에이전트 중지 방지

Skills vs Hooks vs Subagents

차원	Skills	Hooks	Subagents
호출	자동 (LLM 추론)	결정론적 (이벤트 기반)	명시적 또는 자동 위임
보장	확률적 (모델이 결정)	결정론적 (항상 발동)	결정론적 (격리된 컨텍스트)
컨텍스트 비용	메인 컨텍스트에 주입됨	0 (LLM 외부에서 실행)	별도의 컨텍스트 창
토큰 비용	설명 예산 (창의 2%)	0	subagent당 전체 컨텍스트
최적 용도	도메인 전문성	정책 시행	집중 작업, 탐색

FAQ

훅이 몇 개부터 너무 많은 건가요?

제약 조건은 개수가 아니라 성능입니다. 각 훅은 동기적으로 실행되므로, 전체 훅 실행 시간이 매칭된 모든 도구 호출에 더해집니다. 사용자 수준과 프로젝트 수준 설정에 걸쳐 95개의 훅이 있어도 각 훅이 200ms 이내에 완료되면 눈에 띄는 지연 없이 실행됩니다. 주의해야 할 임계점은 다음과 같습니다. PostToolUse 훅이 모든 파일 편집에 500ms 이상을 더한다면, 세션이 느리게 느껴집니다. 배포하기 전에 time으로 훅을 프로파일링하세요.¹⁴

훅이 Claude Code가 명령을 실행하지 못하도록 차단할 수 있나요?

가능합니다. PreToolUse 훅은 코드 2로 종료하여 모든 도구 동작을 차단합니다. Claude Code는 대기 중인 동작을 취소하고 훅의 stderr 출력을 모델에게 표시합니다. Claude는 거부 사유를 확인하고 더 안전한 대안을 제안합니다. Exit 1은 동작이 그대로 진행되는 비차단 경고입니다.³

훅 구성 파일은 어디에 두어야 하나요?

훅 구성은 프로젝트 수준 훅의 경우 .claude/settings.json(저장소에 커밋되어 팀과 공유됨)에, 사용자 수준 훅의 경우 ~/.claude/settings.json(개인용으로 모든 프로젝트에 적용됨)에 둡니다. 둘 다 존재할 경우 프로젝트 수준 훅이 우선 적용됩니다. 작업 디렉터리 문제를 피하기 위해 스크립트 파일에는 절대 경로를 사용하세요.¹⁴

모든 결정이 숙의를 거쳐야 하나요?

아닙니다. 신뢰도 모듈은 네 가지 차원(모호성, 복잡성, 영향도, 컨텍스트 의존성)에 걸쳐 결정을 점수화합니다. 전체 신뢰도가 0.70 미만인 결정만 숙의를 트리거하며, 이는 전체 결정의 약 10%에 해당합니다. 문서 수정, 변수 이름 변경, 일상적인 편집은 숙의를 완전히 건너뜁니다. 보안 아키텍처, 데이터베이스 스키마 변경, 되돌릴 수 없는 배포는 일관되게 숙의를 트리거합니다.⁷

의견 불일치를 만들어내도록 설계된 시스템을 어떻게 테스트하나요?

성공 경로와 실패 경로를 모두 테스트해야 합니다. 성공: 에이전트가 생산적으로 의견을 달리하고 합의에 도달합니다. 실패: 에이전트가 너무 빠르게 수렴하거나, 전혀 수렴하지 않거나, 스폰 예산을 초과합니다. 종단 간 테스트는 결정론적 에이전트 응답으로 각 시나리오를 시뮬레이션하여 두 검증 게이트가 문서화된 모든 실패 모드를 포착하는지 검증합니다. 운영 환경의 숙의 시스템은 세 계층에 걸쳐 141개의 테스트를 실행합니다. 48개의 bash 통합 테스트, 81개의 Python 단위 테스트, 12개의 종단 간 파이프라인 시뮬레이션입니다.⁷

숙의의 지연 시간 영향은 어느 정도인가요?

3-에이전트 숙의는 30~60초의 실제 시간을 추가합니다(에이전트는 Agent tool을 통해 순차적으로 실행됩니다). 10-에이전트 숙의는 2~4분을 추가합니다. 합의 및 pride check 훅은 각각 200ms 이내에 실행됩니다. 주된 병목은 오케스트레이션 오버헤드가 아니라 에이전트당 LLM 추론 시간입니다.⁷

CLAUDE.md 파일은 얼마나 길어야 하나요?

각 섹션은 50줄 미만으로, 전체 파일은 150줄 미만으로 유지하세요. 긴 파일은 컨텍스트 윈도우에서 잘리므로, 가장 중요한 지침을 앞쪽에 배치하세요. 스타일 선호 사항보다 명령어와 클로저 정의를 먼저 두는 식입니다.²¹

이 방식이 Claude Code 외의 도구에서도 작동하나요?

아키텍처 원칙(결정론적 게이트로서의 훅, 도메인 전문성으로서의 skills, 격리된 컨텍스트로서의 subagents, 메모리로서의 파일 시스템)은 어떤 에이전트 시스템에든 개념적으로 적용됩니다. 구체적인 구현은 Claude Code의 라이프사이클 이벤트, 매처 패턴, Agent tool을 사용합니다. AGENTS.md는 동일한 패턴을 Codex, Cursor, Copilot, Amp, Windsurf로 가져갑니다.²¹ 구현 세부 사항은 도구별로 다르더라도, harness 패턴 자체는 도구 비종속적입니다.

빠른 참조 카드

훅 구성

{
  "hooks": {
    "PreToolUse": [{"matcher": "Bash", "hooks": [{"type": "command", "command": "script.sh"}]}],
    "PostToolUse": [{"matcher": "Write|Edit", "hooks": [{"type": "command", "command": "format.sh"}]}],
    "Stop": [{"matcher": "", "hooks": [{"type": "agent", "prompt": "Verify tests pass. $ARGUMENTS"}]}],
    "SessionStart": [{"matcher": "", "hooks": [{"type": "command", "command": "setup.sh"}]}]
  }
}

Skill Frontmatter

---
name: my-skill
description: What it does and when to use it. Include trigger phrases.
allowed-tools: Read, Grep, Glob
---

Subagent 정의

---
name: my-agent
description: When to invoke. Include PROACTIVELY for auto-delegation.
tools: Read, Grep, Glob, Bash
model: opus
permissionMode: plan
---

Instructions for the subagent.

종료 코드

코드	의미	용도
0	성공	작업 허용
2	차단	보안 게이트, 품질 게이트
1	비차단 경고	로깅, 권고 메시지

주요 명령어

명령어	용도
`/compact`	컨텍스트 압축, 결정 사항 보존
`/context`	컨텍스트 할당 및 활성 skills 보기
`/agents`	subagents 관리
`claude -c`	가장 최근 세션 이어가기
`claude --print`	일회성 CLI 호출(대화 없음)
`# <note>`	메모리 파일에 메모 추가
`/memory`	자동 메모리 보기 및 관리

파일 위치

경로	용도
`~/.claude/CLAUDE.md`	개인 전역 지침
`.claude/CLAUDE.md`	프로젝트 지침(git 공유)
`.claude/settings.json`	프로젝트 훅 및 권한
`~/.claude/settings.json`	사용자 훅 및 권한
`~/.claude/skills/<name>/SKILL.md`	개인 skills
`.claude/skills/<name>/SKILL.md`	프로젝트 skills(git 공유)
`~/.claude/agents/<name>.md`	개인 subagent 정의
`.claude/agents/<name>.md`	프로젝트 subagent 정의
`.claude/rules/*.md`	프로젝트 규칙 파일
`~/.claude/rules/*.md`	사용자 규칙 파일
`~/.claude/projects/{path}/memory/MEMORY.md`	자동 메모리

변경 로그

날짜	변경 사항
2026-05-08	가이드 v1.6: Claude Code v2.1.132/v2.1.133 + SDK v0.1.77 Day-2 후속. Skills System에 SDK Skill Surface 하위 섹션을 추가하여 `ClaudeAgentOptions`의 `skills` 옵션과 `allowed_tools`에서 `"Skill"`의 사용 중단을 다룹니다.³⁷ Hook Architecture에 Effort 및 Session Provenance 하위 섹션을 추가하여 hook 입력의 새로운 `effort.level` JSON 필드 + `$CLAUDE_EFFORT` 환경 변수, 그리고 Bash 하위 프로세스의 `CLAUDE_CODE_SESSION_ID` 환경 변수를 다룹니다.³⁸³⁹ Subagent Configuration Fields 표에 Subagent skill 검색 수정 사항을 추가했습니다(subagents는 이제 `Skill` 도구를 통해 project, user, plugin skills를 검색하며, v2.1.133 이전에는 자동으로 누락되었습니다).³⁹ Production Patterns에 Worktree Base, Sandbox Paths, Admin Settings 하위 섹션을 추가하여 `worktree.baseRef`(로컬 `HEAD`에서 `origin/<default>`로 돌아가는 호환성 깨는 기본값 복원), `sandbox.bwrapPath`, `sandbox.socatPath`, `parentSettingsBehavior`를 다룹니다.³⁹
2026-05-07	가이드 v1.5: Claude Managed Agents, 5월 6일 SF 확장. Memory and Context에 Strategy 5(Managed Memory Curation: Dreaming, Research Preview)를 추가하고 filesystem-as-memory와 Dreaming을 대조하는 표를 포함했습니다.³⁵ Multi-Agent Orchestration 상단에 Managed Multiagent Orchestration(Public Beta)와 Outcomes(Public Beta)를 추가하고, shared-filesystem 전문가와 Claude Console 추적에 대한 Anthropic의 원문 인용, 그리고 self-hosted deliberation과의 비교 표를 포함했습니다. `claude-agent-sdk-python` v0.1.74의 `include_hook_events`와 `HookEventMessage`를 다루는 SDK-side hook 이벤트 스트리밍 하위 섹션을 추가했습니다.³⁶ 변경 로그 전용: Claude Code v2.1.124-v2.1.131 (`claude project purge`, 프로젝트 디렉터리에 대한 `--dangerously-skip-permissions`, `skill_activated` `invocation_trigger`, PostToolUse format-on-save 수정, PreToolUse JSON+exit-2 차단 수정, `skillOverrides` 설정); `claude-agent-sdk-python` v0.1.72 (CLI 2.1.126), v0.1.73 (`session_store_flush`), v0.1.75 (CLI 2.1.131), v0.1.76 (`api_error_status`); openai-agents-python v0.15.0-v0.16.1과 v0.16.0(5월 7일)은 기본값을 gpt-5.4-mini로 변경하고 암묵적 `max_turns` 상한을 제거했으며 SDK-side 도구 실행 동시성을 추가했습니다.
2026-05-07	가이드 v1.4: 현재 공식 문서와 로컬 런타임 증거(`claude --version` 2.1.132, `codex --version`은 `codex-cli 0.128.0` 반환)에 맞춰 Claude Code hook 및 skill 메커니즘을 새롭게 정리했습니다. hook 표면을 22/26+개에서 29개의 문서화된 이벤트로 업데이트하고, skill-description 예산을 2%/16,000에서 1%/8,000으로 수정했으며, hook 유형 수를 4개에서 `mcp_tool`을 포함한 5개로 변경하고, 지원되지 않는 고정 “10 parallel subagents” 주장을 제거했으며, AGENTS.md, skills, hooks, plugins, 명시적 subagent 워크플로를 다루는 공개 가능한 Codex parity 섹션을 추가했습니다.
2026-04-29	가이드 v1.3: Managed vs. Self-Hosted Harnesses 섹션에서 OpenAI Agents SDK 범위를 `openai-agents` Python v0.14.0(4월 15일)의 명명된 SDK 표면으로 확장했습니다 — `SandboxAgent`, `Manifest`, `SandboxRunConfig`, progressive disclosure를 포함한 sandbox 메모리, workspace mounts(S3/R2/GCS/Azure), portable snapshots, 그리고 local/Docker/hosted 클라이언트 백엔드(Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop, Vercel). 보조 Help Net Security 인용을 기본 v0.14.0 릴리스 노트 인용으로 교체했습니다. 세 번째 self-hosted 옵션으로서 `claude-agent-sdk-python` v0.1.69-v0.1.71(4월 28-29일)에 대한 짧은 노트를 추가했습니다(Claude Code 런타임을 Python 라이브러리로 임베드): 번들된 Claude CLI가 v2.1.123으로 상향, `mcp` 의존성 하한을 `>=1.19.0`으로 상향(이전 버전은 in-process MCP 도구에서 `CallToolResult`를 자동으로 누락), Trio nursery 취소 수정, TS SDK와 `SandboxNetworkConfig` allowlist-field 패리티. v0.14.7-v0.14.8 SDK 개선 사항은 `[^58]`에 문서화되어 있습니다.
2026-04-25	가이드 v1.2: Google Cloud Next 2026(4월 22-24일) — Vertex AI가 Gemini Enterprise Agent Platform으로 리브랜드; Agentspace가 통합 Gemini Enterprise에 흡수; Workspace Studio(노코드 agent 빌더); Anthropic Claude를 포함한 Model Garden의 200개 이상 모델; Box, Workday, Salesforce, ServiceNow의 파트너 agent; 4개 언어에 걸친 ADK v1.0 stable; Project Mariner(웹 브라우징 agent); API-to-agent 브리지로서 Apigee를 갖춘 관리형 MCP 서버; 150개 조직의 프로덕션에서 운영 중인 A2A protocol v1.0. Microsoft Agent Framework 1.0(2026년 4월): 안정적인 APIs, LTS 약속, 완전한 MCP 지원, .NET + Python. agent 실행과 도구 호출을 실시간으로 시각화하는 브라우저 기반 DevUI는 1.0 stable 표면과 함께 preview로 출시됩니다. Salesforce Headless 360(4월 15일, TDX): 모든 Salesforce 기능(CRM, 서비스, 마케팅, 이커머스)을 API/MCP 도구/CLI 명령으로 노출하여 Claude Code, Cursor, Codex 같은 agent가 브라우저 없이 플랫폼 위에서 빌드할 수 있습니다. (TDX 2026은 4월 15-16일에 진행되었으며, Headless 360 발표는 4월 15일 자입니다.) MetaComp StableX KYA(4월 21일): 규제된 금융 서비스(결제, 컴플라이언스, 자산관리)를 위한 Know Your Agent 거버넌스 프레임워크 — 인가받은 금융 기관에서 처음으로 출시; Claude, Claude Code, OpenClaw 및 기타 호환 AI 플랫폼에서 사용 가능합니다. Claude Managed Agents 가격: 세션 실행 중 시간당 $0.08, 유휴 상태에서는 런타임 비용 없음 — 일반 Claude 모델 토큰 요금에 추가됩니다. (Anthropic의 Claude 가격 페이지 기준, public-beta 출시는 2026년 4월 8일이었습니다.) Memory for Managed Agents는 `managed-agents-2026-04-01` beta 헤더로 2026년 4월 23일에 public beta로 진입했습니다. 모든 Managed Agents 엔드포인트는 이제 이 beta 헤더가 필요합니다.
2026-04-16	가이드 v1.1: Claude Managed Agents(4월 8일 beta)와 OpenAI Agents SDK harness/compute 분리(4월 16일)를 다루는 Managed vs. Self-Hosted Harnesses 섹션을 추가했습니다. Scion cross-tool multi-agent hypervisor(4월 7일, Google)를 추가했습니다. M3MAD-Bench 토론 정체 발견을 문서화했습니다. The Five Principles of Trustworthy Agents(Anthropic, 4월 9일) + MCP/AGENTS.md Linux Foundation 거버넌스를 추가했습니다. Permiso SandyClaw skill-sandbox 참조. 새로운 Opus 4.7 Long-Horizon Patterns: tool-failure resilience, `xhigh` effort tier, token-budget 상한(`task_budget` beta), CLAUDE.md 스캐폴딩을 줄이는 implicit-need awareness.
2026-03-24	최초 발행

참고 자료

Andrej Karpathy의 LLM 에이전트 위에 새로운 레이어로서의 “claws”에 대한 논평. HN 토론 (406 포인트, 917 댓글). ↩
저자의 구현. 84개의 hooks, 48개의 skills, 19개의 agents, 약 15,000줄의 오케스트레이션 코드. Claude Code as Infrastructure에 문서화되어 있습니다. ↩↩↩↩↩↩↩↩
Anthropic, “Claude Code Hooks: Exit Codes.” code.claude.com/docs/en/hooks. 대부분의 이벤트에서 종료 코드 0은 허용, 종료 코드 2는 차단, 종료 코드 1은 경고를 의미하며, WorktreeCreate는 더 엄격합니다. ↩↩↩↩↩
Anthropic, “Extend Claude with Skills.” code.claude.com/docs/en/skills. Skill 구조, frontmatter 필드, LLM 기반 매칭, 그리고 1% / 8,000자 description 예산. ↩↩↩↩↩↩↩
Anthropic, “Claude Code Sub-agents.” code.claude.com/docs/en/sub-agents. 격리된 컨텍스트, worktree 지원, 에이전트 팀. ↩↩↩↩↩
Anthropic, “Claude Code Documentation.” docs.anthropic.com/en/docs/claude-code. 메모리 파일, CLAUDE.md, auto-memory. ↩↩↩↩↩
저자의 멀티 에이전트 deliberation 시스템. 10개의 연구 페르소나, 7단계 상태 머신, 141개의 테스트. Multi-Agent Deliberation에 문서화되어 있습니다. ↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩↩
Simon Willison, “Writing code is cheap now.” Agentic Engineering Patterns. ↩
Laban, Philippe, et al., “LLMs Get Lost In Multi-Turn Conversation,” arXiv:2505.06120, 2025년 5월. Microsoft Research and Salesforce. 15개의 LLM, 200,000개 이상의 대화, 평균 39%의 성능 저하. ↩↩↩
Mikhail Shilkov, “Inside Claude Code Skills: Structure, Prompts, Invocation.” mikhail.io. 스킬 디스커버리, 컨텍스트 주입, available_skills 프롬프트 섹션에 대한 독립적 분석. ↩
Claude Code 소스 코드, SLASH_COMMAND_TOOL_CHAR_BUDGET. github.com/anthropics/claude-code. ↩
Anthropic, “Skill Authoring Best Practices.” platform.claude.com. 500줄 제한, 보조 파일, 명명 규칙. ↩
Anthropic, “Claude Code Hooks: Lifecycle Events.” code.claude.com/docs/en/hooks. 문서화된 29개의 라이프사이클 이벤트, hook 유형, matcher 동작, 비동기 hooks, HTTP hooks, prompt hooks, agent hooks, MCP tool hooks. ↩↩↩↩↩↩↩
저자의 Claude Code hooks 튜토리얼. 처음부터 만든 5개의 프로덕션 hooks. Claude Code Hooks Tutorial에 문서화되어 있습니다. ↩↩↩↩↩
50개 세션에 걸친 저자의 컨텍스트 윈도우 관리. Context Window Management에 문서화되어 있습니다. ↩↩↩↩↩
저자의 Ralph Loop 구현. 파일시스템 상태와 spawn 예산을 활용한 fresh-context 반복. The Ralph Loop에 문서화되어 있습니다. ↩↩↩↩↩↩↩
저자의 deliberation 시스템 아키텍처. 3,500줄의 Python, 12개 모듈, 신뢰도 트리거, 합의 검증. Building AI Systems: From RAG to Agents에 문서화되어 있습니다. ↩↩↩
Nemeth, Charlan, In Defense of Troublemakers: The Power of Dissent in Life and Business, Basic Books, 2018. ↩
Wu, H., Li, Z., and Li, L., “Can LLM Agents Really Debate?” arXiv:2511.07784, 2025. ↩
Liang, T. et al., “Encouraging Divergent Thinking in Large Language Models through Multi-Agent Debate,” EMNLP 2024. ↩
실제 저장소 전반에 걸친 저자의 AGENTS.md 분석. AGENTS.md Patterns에 문서화되어 있습니다. 함께 참고: GitHub Blog, “How to Write a Great agents.md: Lessons from Over 2,500 Repositories.” ↩↩↩↩↩↩↩↩
저자의 quality loop과 evidence gate 방법론. Jiro Craftsmanship 시스템의 일부. ↩
Anthropic, “Claude Managed Agents Overview”. 2026년 4월 8일 퍼블릭 베타 출시. 세션 체크포인팅, 번들 샌드박스, REST API를 제공하는 harness-as-a-service. 가격: 표준 토큰 + 세션 시간당 $0.08. 베타 헤더 managed-agents-2026-04-01. ↩↩
OpenAI, “openai-agents Python v0.14.0 release notes”. 2026년 4월 15일 출시; 발표는 4월 16일에 다뤄졌습니다. 기존 Agent / Runner 흐름 위에 베타 레이어로 Sandbox Agents SDK 표면을 도입합니다: SandboxAgent, Manifest (워크스페이스 계약), SandboxRunConfig, capabilities (셸, 파일시스템 편집, 이미지 검사, skills, 샌드박스 메모리, 압축), 워크스페이스 마운트 (로컬, Git, 원격: S3, R2, GCS, Azure Blob, S3 Files), 경로 정규화와 심볼릭 링크 보존을 포함한 휴대용 스냅샷, 재개를 위한 실행 상태 직렬화. 백엔드: UnixLocalSandboxClient, DockerSandboxClient, 그리고 선택적 extras를 통해 Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop, Vercel을 위한 호스팅 클라이언트. 4월 16일 발표 요약은 Help Net Security에서 볼 수 있습니다. ↩↩
Google Cloud, “Scion: Multi-Agent Hypervisor”. 2026년 4월 7일 오픈소스화. Claude Code, Gemini CLI, 그 외 deep agents를 에이전트별 컨테이너, git worktree, 자격 증명을 갖춘 격리된 프로세스로 오케스트레이션합니다. 로컬/허브/Kubernetes 배포 모드를 지원합니다. InfoQ 보도. ↩
멀티 에이전트 토론 연구 클러스터, 2026년 1분기–2분기. Wu et al., “Can LLM Agents Really Debate?” (arXiv 2511.07784); M3MAD-Bench — 성능 정체와 오해의 소지가 있는 합의에 대한 취약성을 보여주는 멀티 모델 멀티 에이전트 토론 벤치마크; Tool-MAD — 에이전트별 이종 툴 할당 + Faithfulness/Relevance judge 점수. ↩
Anthropic, “Our framework for developing safe and trustworthy agents”. 2026년 4월 9일. 다섯 가지 원칙: 인간 통제, 가치 정렬, 보안, 투명성, 프라이버시. Linux Foundation의 Agentic AI Foundation에 MCP 기증. ↩↩
Permiso Security, “SandyClaw: First Dynamic Sandbox for AI Agent Skills”. 2026년 4월 2일. Sigma/YARA/Nova/Snort 탐지와 증거 기반 판정을 갖춘 스킬 실행 샌드박스. ↩
Anthropic, “Introducing Claude Opus 4.7”. 2026년 4월 16일. 장기 호라이즌 에이전트 개선: Opus 4.6 대비 SWE-Bench 프로덕션 작업 해결 3배, 도구 실패 회복력, xhigh effort 티어, task budgets (베타), 암묵적 필요 인식. Messages API의 호환성 변경 사항은 What’s new in Opus 4.7을 참고하세요. ↩
복합 참조 — OpenAI openai-agents-python v0.14.7 (2026년 4월 28일) 및 v0.14.8 (2026년 4월 29일); Anthropic claude-agent-sdk-python v0.1.69 (4월 28일), v0.1.70 (4월 28일), v0.1.71 (4월 29일). v0.14.7 주요 사항: tool 항목의 tool_name/call_id 편의 속성, Phase 2 메모리 통합 turn 한도 상향, 샌드박스 압축용 GPT-5.5 별칭, tar/zip 멤버 검증 강화, LocalFile 소스의 심볼릭 링크 거부, Responses API 호출에서 미설정 필드 제거. v0.14.8 주요 사항: MCP re-export 임포트 오류 보존, 샌드박스 프롬프트 인스트럭션 섹션 구분. claude-agent-sdk-python v0.1.69는 ClaudeAgentOptions 필드에 docstring을 추가하고 번들된 CLI를 v2.1.121로 업그레이드; v0.1.70은 mcp 의존성 하한선을 >=1.19.0으로 올리고 (이전 버전은 인프로세스 MCP tool 핸들러에서 CallToolResult 반환을 조용히 누락시킴), options.stderr가 설정된 상태로 query()를 반복할 때 조기 취소 시 발생하던 Trio nursery 손상을 수정 (이제 stderr 리더에 spawn_detached()가 사용됨), 번들된 CLI를 v2.1.122로 업그레이드; v0.1.71은 TypeScript 스키마와의 동등성을 위해 SandboxNetworkConfig에 도메인 허용 목록 필드 (allowedDomains, deniedDomains, allowManagedDomainsOnly, allowMachLookup)를 추가하고 번들된 CLI를 v2.1.123으로 업그레이드. ↩
OpenAI, “Custom instructions with AGENTS.md”. Codex는 작업 전에 글로벌 및 프로젝트 AGENTS.md / AGENTS.override.md 파일을 읽고, 루트에서 현재 디렉터리까지의 가이드를 병합하며, project_doc_max_bytes로 프로젝트 문서를 제한합니다. ↩
OpenAI, “Agent Skills”. Codex 스킬은 SKILL.md, 점진적 디스클로저, 명시적 $skill 호출, description으로부터의 암묵적 활성화를 사용합니다. ↩
OpenAI, “Codex Hooks”. Codex hooks는 config의 command hooks, 플러그인 hooks, 관리되는 hooks, 지원되는 이벤트의 matcher, stdin JSON 입력, JSON 출력 필드를 지원합니다. ↩
OpenAI, “Codex Subagents” 및 “Codex CLI 0.128.0 changelog”. Codex는 명시적 병렬 subagent 워크플로우, 내장 default, worker, explorer 에이전트, 커스텀 TOML 에이전트, 상속된 샌드박스 정책, 플러그인 번들 hooks, hook 활성화 상태, 0.128.0의 영구 저장된 /goal 워크플로우를 지원합니다. ↩
Anthropic, “New in Claude Managed Agents”. 2026년 5월 6일. Dreaming (리서치 프리뷰): 에이전트 세션과 메모리 저장소를 검토하여 패턴을 추출하고 메모리를 큐레이션하는 예약된 백그라운드 프로세스. Outcomes (퍼블릭 베타): 별도의 grader가 자체 컨텍스트 윈도우에서 루브릭에 대해 출력을 채점하여 에이전트의 추론에 영향을 받지 않도록 하는 루브릭 기반 평가. Multiagent Orchestration (퍼블릭 베타): 리드 에이전트가 작업의 일부를 각자의 모델, 프롬프트, 도구를 가진 스페셜리스트에게 위임; 스페셜리스트는 공유 파일시스템에서 병렬로 작업하고 리드 에이전트의 전체 컨텍스트에 기여하며, Claude Console에서 단계별 전체 추적이 가능합니다. ↩↩↩↩↩↩↩↩
Anthropic, claude-agent-sdk-python v0.1.74. 2026년 5월 6일. ClaudeAgentOptions에 include_hook_events를 추가; 설정 시 hook 이벤트 (PreToolUse, PostToolUse, Stop 등)가 CLI에서 emit되어 메시지 스트림에서 HookEventMessage로 yield되며, TypeScript SDK의 includeHookEvents를 미러링합니다. 번들된 Claude CLI는 v2.1.129로 업그레이드되었습니다. ↩↩
Anthropic, claude-agent-sdk-python v0.1.77. 2026년 5월 8일. allowed_tools의 "Skill" 값을 deprecated 처리하고 ClaudeAgentOptions의 전용 skills 옵션을 도입하여 Claude Code에 사용 가능한 skills에 대한 더 구조화된 신호를 제공하며, Command failed 예외의 오류 메시지를 개선하고 Claude CLI v2.1.133을 번들합니다. ↩↩
Anthropic, Claude Code v2.1.132. 2026년 5월 6일. Bash 도구 서브프로세스에 CLAUDE_CODE_SESSION_ID 환경 변수 추가 (hooks가 이미 보는 session_id와 일치), 대화를 네이티브 스크롤백에 유지하기 위한 CLAUDE_CODE_DISABLE_ALTERNATE_SCREEN, 갱신된 /tui fullscreen 시작 배너 (낮은 메모리, 마우스 지원, 선택 시 자동 복사), 그리고 SIGINT graceful shutdown, surrogate 이모지 --resume 손상, 플랜 모드 --permission-mode 플래그, Indic 및 ZWJ 커서 처리, NFD vim ops, 페이스트 시작 / 삼킴, MCP 무제한 메모리, MCP tools/list 재시도, Bedrock + Vertex ENABLE_PROMPT_CACHING_1H 400, statusline context_window의 누적 토큰 표시 등 약 20개의 버그 수정. ↩↩
Anthropic, Claude Code v2.1.133. 2026년 5월 7일. Hooks가 이제 effort.level JSON 입력 + $CLAUDE_EFFORT 환경 변수를 받습니다 (Bash 명령어에서도 읽을 수 있음). Subagents는 Skill 도구를 통해 프로젝트, 사용자, 플러그인 skills를 발견합니다 (회귀 수정). 새로운 관리자 설정: worktree.baseRef (fresh | head)는 v2.1.128에서 로컬 HEAD로 전환된 후 worktree base를 origin/<default>로 되돌립니다; sandbox.bwrapPath와 sandbox.socatPath는 Linux/WSL에서 샌드박스 바이너리를 고정합니다; parentSettingsBehavior ('first-wins' | 'merge')는 SDK managedSettings가 부모 설정과 어떻게 구성되는지를 제어합니다. 기타 수정 사항: 병렬 세션의 401-after-refresh-token-race, drive-root allow-rule 스코핑, MCP OAuth 프록시/mTLS 지원, 취소를 완료하는 Remote Control stop/interrupt, 세션 간 /effort 누출, --help에 --remote-control 등재. ↩↩↩↩↩↩