클로드 코드 토큰 경제학 시리즈 3편: Claude Code의 토큰 비용 구조 - 숨겨진 비용의 정체

💡 시리즈 소개: 이 시리즈는 Claude Code 사용자를 위한 토큰 경제학 가이드입니다. 이번 편에서는 Claude Code에서 토큰이 어디서 발생하는지, 왜 예상보다 비용이 높은지 파헤칩니다.

"짧게 물었는데 왜 비싸지?"

Claude Code를 사용하다 보면 이런 의문이 듭니다:

"간단한 질문인데 토큰이 왜 이렇게 많이 쓰였지?"
"파일 하나만 봤는데 비용이 크네?"
"반복할수록 비용이 기하급수적으로 늘어나는 것 같은데..."

이유는 단순합니다. Claude Code의 비용은 '질문 길이'가 아니라 '워크플로 오버헤드'가 결정하기 때문입니다.

토큰이 발생하는 5가지 핵심 지점

1. 세션 시작 시 고정비

Claude Code 세션이 시작되면 컨텍스트에 자동으로 로드되는 것들:

┌─────────────────────────────────────┐
│        세션 시작 시 로드             │
├─────────────────────────────────────┤
│ • 시스템 프롬프트 (동작 규칙)         │
│ • 프로젝트 지침 (CLAUDE.md)          │
│ • 기본 도구 설명                     │
│ • 스킬/메타데이터                    │
└─────────────────────────────────────┘

한 블로그의 측정에 따르면, Claude Code 시스템 프롬프트만 약 3,900 토큰에 달합니다.

💡 "각 MCP 서버가 idle 상태여도 도구 정의를 컨텍스트에 추가한다" - Anthropic 공식 문서

2. MCP 도구 정의 - 가장 위험한 폭발 지점

에이전트 환경에서 가장 간과하기 쉬운 사실:
도구 호출 결과만이 아니라, 도구 정의 자체가 텍스트로 컨텍스트에 포함됩니다.

실제 측정 사례 (Anthropic 엔지니어링 블로그)

시나리오	토큰 소비
58개 도구 전통 로드	~55K tokens
Tool Search 적용 후	8.7K tokens
절감률	약 85%

또 다른 사례에서는 도구 정의만으로 134K tokens가 소비되었다는 보고도 있습니다.

MCP 오버헤드 실측 사례

한 개발자의 측정에 따르면, 2개의 Chrome 관련 MCP만으로 31,700 토큰 오버헤드가 발생했습니다.

┌────────────────────────────────────────┐
│     도구 정의 오버헤드 시각화           │
├────────────────────────────────────────┤
│                                        │
│  사용자 질문:     "파일 읽어줘" (20 tokens) │
│                                        │
│  + 시스템 프롬프트:          3,900 tokens │
│  + MCP 도구 정의:           31,700 tokens │
│  ─────────────────────────────────────  │
│  실제 컨텍스트:            35,620+ tokens │
│                                        │
└────────────────────────────────────────┘

⚠️ 핵심 교훈: 도구를 "많이 연결하는 것"은 곧 "큰 프롬프트를 항상 들고 다니는 것"입니다.

3. 파일 컨텍스트 - "읽는 순간 토큰"

Claude Code에서 파일을 열어 본문을 모델 컨텍스트에 넣는 순간, 그 텍스트는 입력 토큰이 됩니다.

포맷팅 오버헤드 문제

단순히 파일 내용만 들어가는 게 아닙니다. 라인 번호, 포맷팅 등의 오버헤드가 붙습니다.

GitHub 이슈 #20223에 따르면:

Read 툴 및 @파일 로딩 시 약 70% 토큰 오버헤드 (≈1.7배) 발생

예시 계산:
- 원본 파일: 100K tokens
- 실제 컨텍스트: 100K × 1.7 = 170K tokens

⚠️ "내 파일이 100K 토큰이니 안전하다"가 아니라, 컨텍스트에 주입되는 포맷 기준으로 계산해야 합니다.

4. 도구 실행 결과 - 로그의 덫

도구 호출 자체(명령 이름/인자)는 토큰이 적습니다. 하지만 stdout/stderr가 길어지면 그 결과가 다시 컨텍스트에 들어갑니다.

토큰이 폭발하는 시나리오

1단계: 테스트 실행 요청
       → 도구 호출 (10 tokens)

2단계: 테스트 실패 로그 반환
       → 로그 내용 (5,000 tokens)

3단계: 다음 요청 시
       → 이전 대화 + 로그 재전송 (5,000+ tokens)

4단계: 수정 후 재실행
       → 누적 로그 (10,000+ tokens)

... 반복할수록 기하급수적 증가

"로그 길이 × 반복 횟수"로 누적 비용이 폭증합니다.

5. 반복 루프와 컴팩션

Claude Code의 전형적인 디버깅 루프:

읽기 → 수정 → 실행 → 에러 → 재수정 → 실행 → ...

매 턴마다 다음이 추가됩니다:

사용자/모델 대화
읽은 파일 스니펫
실행 결과 로그
패치/설명

컴팩션(자동 요약)의 양면성

Claude Code는 컨텍스트가 커질 때 자동 요약/압축(compaction)을 활용할 수 있습니다.

장점	단점
토큰 사용량 감소	세부 정보 손실 위험
컨텍스트 초과 방지	디버깅 재현성 저하
장기 세션 가능	중요 맥락 누락 가능

💡 컴팩션은 무료가 아닙니다. 요약본 생성 과정에서 추가 토큰이 사용됩니다.

실제 사례: 토큰 폭발의 해부

시나리오: 소규모 리팩토링 (5회 왕복)

환경 가정

3개 파일, 각 300 LOC
평균 60 chars/line

토큰 계산

파일 전체: 3 × 300 × 60 = 54,000 chars ≈ 13.5K tokens

요청 1: 파일 13.5K + 시스템 500 + 출력 800 = ~14.8K
요청 2: 히스토리 14.8K + 지시 200 + 출력 600 = ~15.6K
요청 3: 히스토리 15.6K + 로그 2K + 출력 700 = ~18.3K
요청 4~5: 유사 규모 반복

5회 라운드 누적 합계: ~80K+ tokens

시나리오: 중간 규모 + 상세 로그

환경 가정

8개 파일, 각 600 LOC
빌드 실패 로그 포함

토큰 계산

파일 전체: 8 × 600 × 60 = 288,000 chars ≈ 72K tokens

요청 1: 73K 수준
요청 3: 빌드 로그 50K 포함 → 125K 근접
3~5회 반복: 350K~450K tokens 누적 가능

⚠️ 중간 규모 작업도 200K 경계를 쉽게 넘어 프리미엄 요율이 적용될 수 있습니다.

서브에이전트의 숨겨진 비용

Claude Code 문서에 따르면:

"에이전트 팀은 표준 세션의 ~7배 토큰을 사용한다"

서브에이전트/에이전트 팀은 컨텍스트가 분리되어 토큰 사용이 곱셈적으로 증가합니다.

┌────────────────────────────────────┐
│       에이전트 토큰 사용            │
├────────────────────────────────────┤
│                                    │
│  단일 세션:     1x 토큰             │
│                                    │
│  서브에이전트:  컨텍스트 복제        │
│                × 에이전트 수        │
│                ≈ 7x 토큰            │
│                                    │
└────────────────────────────────────┘

토큰 발생 지점 총정리

발생 지점	특성	영향도
시스템 프롬프트	고정비, 매 세션	중 (3K~24K)
MCP 도구 정의	고정비, 도구 수에 비례	최대 (31K~72K+)
파일 컨텍스트	변동, 포맷팅 1.7배	대 (파일 크기 의존)
도구 실행 결과	변동, 누적됨	대 (로그 길이 의존)
반복 히스토리	누적, 기하급수적	최대 (턴 수 의존)
서브에이전트	곱셈적 증가	최대 (7배 가능)

핵심 인사이트

"Claude Code가 토큰을 먹는 게 아니라, 워크플로가 먹는다"

사용자 질문은 비용의 일부일 뿐
도구 정의가 초기 폭발의 주범
파일 로딩에 70% 오버헤드 발생
로그 누적이 기하급수적 증가 유발
서브에이전트는 비용을 7배로 만듦

다음 편 예고

4편: 짧은 Q&A vs 긴 문서 요약 - 작업유형별 토큰 소모 분석

작업 유형에 따라 토큰 소모 패턴이 어떻게 달라지는지, 각 유형별 최적화 전략을 알아봅니다.

참고 자료

Claude Code 공식 문서

Claude Code Costs - Claude Code 비용 가이드
How Claude Code Works - Claude Code 작동 방식

Anthropic 엔지니어링

Advanced Tool Use - Tool Search 및 도구 최적화 (55K→8.7K 절감 사례)
Code Execution with MCP - MCP 코드 실행 효율화

커뮤니티 측정 사례

Claude Code Hidden MCP Flag - MCP 오버헤드 측정 (시스템 프롬프트 3.9K, MCP 31.7K)
GitHub Issue #20223 - 파일 포맷팅 오버헤드 (1.7배) 측정

📚 클로드 코드 토큰 경제학 시리즈 | 2026년 2월

'AI' 카테고리의 다른 글

클로드 코드 토큰 경제학 시리즈 5편: 코드 작업의 토큰 경제학 - 파일, diff, 로그의 비밀 (0)	2026.02.12
클로드 코드 토큰 경제학 시리즈 4편: 짧은 Q&A vs 긴 문서 요약 - 작업유형별 토큰 소모 분석 (0)	2026.02.12
클로드 코드 토큰 경제학 시리즈 2편: Claude 모델 라인업 - Haiku, Sonnet, Opus 완벽 비교 (0)	2026.02.12
클로드 코드 토큰 경제학 시리즈 1편: 토큰이란? AI 비용의 기본 단위 이해하기 (0)	2026.02.12
클로드 코드 토큰 경제학 시리즈 소개 (0)	2026.02.12

클로드 코드 토큰 경제학 시리즈 3편: Claude Code의 토큰 비용 구조 - 숨겨진 비용의 정체

"짧게 물었는데 왜 비싸지?"

토큰이 발생하는 5가지 핵심 지점

1. 세션 시작 시 고정비

2. MCP 도구 정의 - 가장 위험한 폭발 지점

실제 측정 사례 (Anthropic 엔지니어링 블로그)

MCP 오버헤드 실측 사례

3. 파일 컨텍스트 - "읽는 순간 토큰"

포맷팅 오버헤드 문제

4. 도구 실행 결과 - 로그의 덫

토큰이 폭발하는 시나리오

5. 반복 루프와 컴팩션

컴팩션(자동 요약)의 양면성

실제 사례: 토큰 폭발의 해부

시나리오: 소규모 리팩토링 (5회 왕복)

시나리오: 중간 규모 + 상세 로그

서브에이전트의 숨겨진 비용

토큰 발생 지점 총정리

핵심 인사이트

다음 편 예고

참고 자료

Claude Code 공식 문서

Anthropic 엔지니어링

커뮤니티 측정 사례

'AI' 카테고리의 다른 글

티스토리툴바