클로드 코드 토큰 경제학 시리즈 3편: Claude Code의 토큰 비용 구조 - 숨겨진 비용의 정체
💡 시리즈 소개: 이 시리즈는 Claude Code 사용자를 위한 토큰 경제학 가이드입니다. 이번 편에서는 Claude Code에서 토큰이 어디서 발생하는지, 왜 예상보다 비용이 높은지 파헤칩니다.
"짧게 물었는데 왜 비싸지?"
Claude Code를 사용하다 보면 이런 의문이 듭니다:
- "간단한 질문인데 토큰이 왜 이렇게 많이 쓰였지?"
- "파일 하나만 봤는데 비용이 크네?"
- "반복할수록 비용이 기하급수적으로 늘어나는 것 같은데..."
이유는 단순합니다. Claude Code의 비용은 '질문 길이'가 아니라 '워크플로 오버헤드'가 결정하기 때문입니다.
토큰이 발생하는 5가지 핵심 지점
1. 세션 시작 시 고정비
Claude Code 세션이 시작되면 컨텍스트에 자동으로 로드되는 것들:
┌─────────────────────────────────────┐
│ 세션 시작 시 로드 │
├─────────────────────────────────────┤
│ • 시스템 프롬프트 (동작 규칙) │
│ • 프로젝트 지침 (CLAUDE.md) │
│ • 기본 도구 설명 │
│ • 스킬/메타데이터 │
└─────────────────────────────────────┘한 블로그의 측정에 따르면, Claude Code 시스템 프롬프트만 약 3,900 토큰에 달합니다.
💡 "각 MCP 서버가 idle 상태여도 도구 정의를 컨텍스트에 추가한다" - Anthropic 공식 문서
2. MCP 도구 정의 - 가장 위험한 폭발 지점
에이전트 환경에서 가장 간과하기 쉬운 사실:
도구 호출 결과만이 아니라, 도구 정의 자체가 텍스트로 컨텍스트에 포함됩니다.
실제 측정 사례 (Anthropic 엔지니어링 블로그)
| 시나리오 | 토큰 소비 |
|---|---|
| 58개 도구 전통 로드 | ~55K tokens |
| Tool Search 적용 후 | 8.7K tokens |
| 절감률 | 약 85% |
또 다른 사례에서는 도구 정의만으로 134K tokens가 소비되었다는 보고도 있습니다.
MCP 오버헤드 실측 사례
한 개발자의 측정에 따르면, 2개의 Chrome 관련 MCP만으로 31,700 토큰 오버헤드가 발생했습니다.
┌────────────────────────────────────────┐
│ 도구 정의 오버헤드 시각화 │
├────────────────────────────────────────┤
│ │
│ 사용자 질문: "파일 읽어줘" (20 tokens) │
│ │
│ + 시스템 프롬프트: 3,900 tokens │
│ + MCP 도구 정의: 31,700 tokens │
│ ───────────────────────────────────── │
│ 실제 컨텍스트: 35,620+ tokens │
│ │
└────────────────────────────────────────┘
⚠️ 핵심 교훈: 도구를 "많이 연결하는 것"은 곧 "큰 프롬프트를 항상 들고 다니는 것"입니다.
3. 파일 컨텍스트 - "읽는 순간 토큰"
Claude Code에서 파일을 열어 본문을 모델 컨텍스트에 넣는 순간, 그 텍스트는 입력 토큰이 됩니다.
포맷팅 오버헤드 문제
단순히 파일 내용만 들어가는 게 아닙니다. 라인 번호, 포맷팅 등의 오버헤드가 붙습니다.
GitHub 이슈 #20223에 따르면:
- Read 툴 및 @파일 로딩 시 약 70% 토큰 오버헤드 (≈1.7배) 발생
예시 계산:
- 원본 파일: 100K tokens
- 실제 컨텍스트: 100K × 1.7 = 170K tokens
⚠️ "내 파일이 100K 토큰이니 안전하다"가 아니라, 컨텍스트에 주입되는 포맷 기준으로 계산해야 합니다.
4. 도구 실행 결과 - 로그의 덫
도구 호출 자체(명령 이름/인자)는 토큰이 적습니다. 하지만 stdout/stderr가 길어지면 그 결과가 다시 컨텍스트에 들어갑니다.
토큰이 폭발하는 시나리오
1단계: 테스트 실행 요청
→ 도구 호출 (10 tokens)
2단계: 테스트 실패 로그 반환
→ 로그 내용 (5,000 tokens)
3단계: 다음 요청 시
→ 이전 대화 + 로그 재전송 (5,000+ tokens)
4단계: 수정 후 재실행
→ 누적 로그 (10,000+ tokens)
... 반복할수록 기하급수적 증가"로그 길이 × 반복 횟수"로 누적 비용이 폭증합니다.
5. 반복 루프와 컴팩션
Claude Code의 전형적인 디버깅 루프:
읽기 → 수정 → 실행 → 에러 → 재수정 → 실행 → ...매 턴마다 다음이 추가됩니다:
- 사용자/모델 대화
- 읽은 파일 스니펫
- 실행 결과 로그
- 패치/설명
컴팩션(자동 요약)의 양면성
Claude Code는 컨텍스트가 커질 때 자동 요약/압축(compaction)을 활용할 수 있습니다.
| 장점 | 단점 |
|---|---|
| 토큰 사용량 감소 | 세부 정보 손실 위험 |
| 컨텍스트 초과 방지 | 디버깅 재현성 저하 |
| 장기 세션 가능 | 중요 맥락 누락 가능 |
💡 컴팩션은 무료가 아닙니다. 요약본 생성 과정에서 추가 토큰이 사용됩니다.
실제 사례: 토큰 폭발의 해부
시나리오: 소규모 리팩토링 (5회 왕복)
환경 가정
- 3개 파일, 각 300 LOC
- 평균 60 chars/line
토큰 계산
파일 전체: 3 × 300 × 60 = 54,000 chars ≈ 13.5K tokens
요청 1: 파일 13.5K + 시스템 500 + 출력 800 = ~14.8K
요청 2: 히스토리 14.8K + 지시 200 + 출력 600 = ~15.6K
요청 3: 히스토리 15.6K + 로그 2K + 출력 700 = ~18.3K
요청 4~5: 유사 규모 반복
5회 라운드 누적 합계: ~80K+ tokens시나리오: 중간 규모 + 상세 로그
환경 가정
- 8개 파일, 각 600 LOC
- 빌드 실패 로그 포함
토큰 계산
파일 전체: 8 × 600 × 60 = 288,000 chars ≈ 72K tokens
요청 1: 73K 수준
요청 3: 빌드 로그 50K 포함 → 125K 근접
3~5회 반복: 350K~450K tokens 누적 가능
⚠️ 중간 규모 작업도 200K 경계를 쉽게 넘어 프리미엄 요율이 적용될 수 있습니다.
서브에이전트의 숨겨진 비용
Claude Code 문서에 따르면:
"에이전트 팀은 표준 세션의 ~7배 토큰을 사용한다"
서브에이전트/에이전트 팀은 컨텍스트가 분리되어 토큰 사용이 곱셈적으로 증가합니다.
┌────────────────────────────────────┐
│ 에이전트 토큰 사용 │
├────────────────────────────────────┤
│ │
│ 단일 세션: 1x 토큰 │
│ │
│ 서브에이전트: 컨텍스트 복제 │
│ × 에이전트 수 │
│ ≈ 7x 토큰 │
│ │
└────────────────────────────────────┘토큰 발생 지점 총정리
| 발생 지점 | 특성 | 영향도 |
|---|---|---|
| 시스템 프롬프트 | 고정비, 매 세션 | 중 (3K~24K) |
| MCP 도구 정의 | 고정비, 도구 수에 비례 | 최대 (31K~72K+) |
| 파일 컨텍스트 | 변동, 포맷팅 1.7배 | 대 (파일 크기 의존) |
| 도구 실행 결과 | 변동, 누적됨 | 대 (로그 길이 의존) |
| 반복 히스토리 | 누적, 기하급수적 | 최대 (턴 수 의존) |
| 서브에이전트 | 곱셈적 증가 | 최대 (7배 가능) |
핵심 인사이트
"Claude Code가 토큰을 먹는 게 아니라, 워크플로가 먹는다"- 사용자 질문은 비용의 일부일 뿐
- 도구 정의가 초기 폭발의 주범
- 파일 로딩에 70% 오버헤드 발생
- 로그 누적이 기하급수적 증가 유발
- 서브에이전트는 비용을 7배로 만듦
다음 편 예고
4편: 짧은 Q&A vs 긴 문서 요약 - 작업유형별 토큰 소모 분석
작업 유형에 따라 토큰 소모 패턴이 어떻게 달라지는지, 각 유형별 최적화 전략을 알아봅니다.
참고 자료
Claude Code 공식 문서
- Claude Code Costs - Claude Code 비용 가이드
- How Claude Code Works - Claude Code 작동 방식
Anthropic 엔지니어링
- Advanced Tool Use - Tool Search 및 도구 최적화 (55K→8.7K 절감 사례)
- Code Execution with MCP - MCP 코드 실행 효율화
커뮤니티 측정 사례
- Claude Code Hidden MCP Flag - MCP 오버헤드 측정 (시스템 프롬프트 3.9K, MCP 31.7K)
- GitHub Issue #20223 - 파일 포맷팅 오버헤드 (1.7배) 측정
📚 클로드 코드 토큰 경제학 시리즈 | 2026년 2월
'AI' 카테고리의 다른 글
| 클로드 코드 토큰 경제학 시리즈 5편: 코드 작업의 토큰 경제학 - 파일, diff, 로그의 비밀 (0) | 2026.02.12 |
|---|---|
| 클로드 코드 토큰 경제학 시리즈 4편: 짧은 Q&A vs 긴 문서 요약 - 작업유형별 토큰 소모 분석 (0) | 2026.02.12 |
| 클로드 코드 토큰 경제학 시리즈 2편: Claude 모델 라인업 - Haiku, Sonnet, Opus 완벽 비교 (0) | 2026.02.12 |
| 클로드 코드 토큰 경제학 시리즈 1편: 토큰이란? AI 비용의 기본 단위 이해하기 (0) | 2026.02.12 |
| 클로드 코드 토큰 경제학 시리즈 소개 (0) | 2026.02.12 |
