클로드 코드 토큰 경제학 시리즈 5편: 코드 작업의 토큰 경제학 - 파일, diff, 로그의 비밀

💡 시리즈 소개: 이 시리즈는 Claude Code 사용자를 위한 토큰 경제학 가이드입니다. 이번 편에서는 코드 작성·리팩토링 작업의 토큰 소모 패턴을 분석합니다.

코드 작업은 다르다

텍스트 작업과 달리, 코드 작업의 토큰은 대화 텍스트 외의 요소에서 결정됩니다:

파일 포함 방식 (@파일 전체 vs 부분)
변경 표현 방식 (diff vs 전체 파일)
테스트/빌드 로그 길이
반복 디버깅 루프 수

"코드 워크플로 최적화는 모델 선택보다 먼저 입력 구조를 바꾸는 문제입니다."

코드 작업에서 토큰이 생기는 지점

1. 파일 참조 (@path)

@file로 참조하면 해당 파일의 전체 내용이 컨텍스트에 포함됩니다.

@src/components/Header.tsx
→ 전체 파일 내용이 입력 토큰으로 계산

2. 포맷팅 오버헤드

파일 내용 + 라인 번호 등 포맷팅으로 약 70% 증가 (1.7배)

원본: 60K 토큰
실제 컨텍스트: 60K × 1.7 ≈ 102K 토큰

3. 도구 실행 결과

테스트/빌드/grep/curl 결과가 다시 컨텍스트에 들어감

4. 모델의 내부 추론

extended thinking 사용 시 출력 토큰 추가 발생

5. 히스토리 누적

후속 요청이 이전 메시지를 컨텍스트로 포함 → 매번 재전송/재처리

토큰을 크게 늘리는 "주범" 우선순위

전체 파일을 여러 번 재전송 (파일 수·길이)
긴 테스트/빌드 로그 전체 포함
대화 히스토리 전체가 매 요청마다 재전송
대규모 diff 대신 전체 파일 다시 포함
verbose AST/덤프 남발

"Claude Code가 토큰을 먹는 게 아니라, 워크플로가 먹는다"

표현 방식이 만드는 토큰 격차

Full File vs Unified Diff

시나리오: 4개 파일, 각 400 LOC, 평균 60 chars/line

표현 방식	계산	토큰
Full files	4×400×60 = 96,000 chars	~24K tokens
Unified diff	4×20×60 = 4,800 chars + 설명	~1.5-2K tokens

💡 10배 이상 차이! 같은 수정이라도 표현 방식이 비용을 결정합니다.

AST Dump의 위험

AST dump는 파일당 30K~80K chars가 될 수 있어, 전체 파일보다 더 클 수 있습니다.

방식	4개 파일 기준 토큰
Full files	~24K
Unified diff	~1.5-2K
AST dump	30K~80K

테스트/빌드 로그가 토큰을 폭발시키는 방식

문제 상황

1. 테스트 실패 → 전체 로그 (수만 줄) 포함
2. 한 요청만으로 수만 토큰 소비
3. 동일 로그가 세션 히스토리에 남음
4. 계속 재전송되며 누적 폭증

해결책

문제	해결
전체 로그 포함	관련 스택트레이스 200~500줄만 발췌
반복 전송	상위 에러 메시지만 요약
상세 필요 시	모델이 요청할 때만 상세 로그 제공

누적 토큰 시나리오: 디버깅 루프

시나리오 A: 소규모 중간 리팩토링

환경

3 파일 × 300 LOC × 60 chars
5회 왕복 디버깅

계산

파일 전체: 54,000 chars ≈ 13.5K tokens

요청1: 입력(13.5K + 시스템 500) + 출력 800
      ≈ 14.8K

요청2: 히스토리 14.8K + 지시 200 + 출력 600
      ≈ 15.6K

요청3: 히스토리 15.6K + 로그 발췌 2K + 출력 700
      ≈ 18.3K

요청4~5: 유사 규모 반복

───────────────────────────────────────
5회 라운드 누적 합계: ~82K~84K tokens

시나리오 B: 중간 규모 + 상세 로그

환경

8 파일 × 600 LOC
대형 빌드 로그 포함

계산

파일 전체: 288,000 chars ≈ 72K tokens

요청1: ~73.8K (입력 72.8K + 출력 1K)

요청3: 대형 빌드 로그 50K 포함
      → 입력 ~125K 근접

3~5회 반복 시:
───────────────────────────────────────
누적 합계: 350K~450K tokens

⚠️ 200K 경계 초과 → 프리미엄 요율 적용!

시나리오 C: 매우 큰 코드베이스

환경

20 파일 × 2,000 LOC

계산

파일 전체: 2.4M chars ≈ 600K tokens

⚠️ Sonnet 200K 한도 초과 → 단일 요청 불가
⚠️ Opus 1M 베타에서만 가능
⚠️ 200K 초과 프리미엄 과금 리스크

입력 규모별 가능 작업 가이드

5K 토큰

가능 작업:
- 소수 파일 (수십~수백 라인)
- 짧은 로그
- 단일 함수 수정

추천 모델: Haiku 또는 Sonnet
이유: 저비용, 빠른 반복

20K 토큰

가능 작업:
- 수 파일 × 수백 LOC
- 로그 발췌 수십 KB
- 2~5회 왕복

필수 전략:
- diff/patch + 부분 발췌
- prompt caching 권장

100K 토큰

가능 작업:
- 대규모 리팩토링
- 대량 로그 분석
- Sonnet 200K 한도 내 가능

필수 전략:
- 토큰 절감 패턴 필수
- 200K 임계치 모니터링
- MCP/도구는 지연 로딩

추천 모델: Opus (복잡한 에이전트/대규모 변경)

코드 작업 토큰 절감 핵심 전략

1. Diff/Patch 중심 워크플로

❌ 전체 파일 생성/재출력
✅ diff/patch 포맷을 표준으로

효과: 입력/출력 토큰 모두 대폭 감소

2. 필요한 파일만 포함

❌ @entire-codebase
✅ @specific-file.ts (필요한 부분만)

3. 로그 발췌 정책

전체 로그 → 상위 에러 + 관련 스택트레이스만
원본 로그 → 파일로 보관, 필요시 참조

4. 반복 턴 최소화

❌ 여러 번 나눠 묻기
✅ 한 번에 목표/제약/체크리스트 정리

5. 서브에이전트 사용 자제

서브에이전트 = 컨텍스트 복제 = ~7배 토큰
정말 필요한 경우만 사용

Full File vs Diff 비교 요약

항목	Full File	Unified Diff
4파일×400LOC	~24K tokens	~1.5-2K tokens
비용 (Sonnet)	~$0.07	~$0.005
비용 (Opus)	~$0.12	~$0.008
비율	100%	~8%

"코딩 모델을 바꾸는 것"보다 "표현 방식을 바꾸는 것"이 더 큰 절감 효과를 냅니다.

핵심 정리

토큰 폭발 주범

전체 파일 반복 전송
긴 로그 포함
히스토리 누적
AST dump 남발

해결 전략

Diff/Patch 중심으로 전환
로그는 발췌만 포함
필요한 파일만 참조
반복 최소화 (한 번에 명확하게)

비용 감각

시나리오	토큰	Sonnet 비용
소규모 5회 루프	~82K	~$0.37
중규모 + 로그	~350K+	~$1.50+
대규모 코드베이스	600K+	한도 초과

다음 편 예고

6편: 5k/20k/100k 입력 시나리오 - 현실적인 비용 예측하기

실제 입력 규모별로 현실적인 토큰 총량과 비용을 계산하는 방법을 알아봅니다.

참고 자료

Claude Code 공식 문서

Claude Code Costs - Claude Code 비용 가이드
Claude Code Common Workflows - 일반적인 워크플로

최적화 기술

Prompt Caching - 프롬프트 캐싱
Compaction - 컨텍스트 압축

커뮤니티 분석

Claude Code Isn't Eating Your Tokens - 워크플로 기반 토큰 분석
GitHub Issue #20223 - 파일 포맷팅 오버헤드 측정

📚 클로드 코드 토큰 경제학 시리즈 | 2026년 2월

'AI' 카테고리의 다른 글

클로드 코드 토큰 경제학 시리즈 7편: 토큰 최적화 실전 가이드 - Tool Search, 캐시, 컴팩션 (0)	2026.02.12
클로드 코드 토큰 경제학 시리즈 6편: 5k/20k/100k 입력 시나리오 - 현실적인 비용 예측하기 (0)	2026.02.12
클로드 코드 토큰 경제학 시리즈 4편: 짧은 Q&A vs 긴 문서 요약 - 작업유형별 토큰 소모 분석 (0)	2026.02.12
클로드 코드 토큰 경제학 시리즈 3편: Claude Code의 토큰 비용 구조 - 숨겨진 비용의 정체 (0)	2026.02.12
클로드 코드 토큰 경제학 시리즈 2편: Claude 모델 라인업 - Haiku, Sonnet, Opus 완벽 비교 (0)	2026.02.12

클로드 코드 토큰 경제학 시리즈 5편: 코드 작업의 토큰 경제학 - 파일, diff, 로그의 비밀

코드 작업은 다르다

코드 작업에서 토큰이 생기는 지점

1. 파일 참조 (@path)

2. 포맷팅 오버헤드

3. 도구 실행 결과

4. 모델의 내부 추론

5. 히스토리 누적

토큰을 크게 늘리는 "주범" 우선순위

표현 방식이 만드는 토큰 격차

Full File vs Unified Diff

AST Dump의 위험

테스트/빌드 로그가 토큰을 폭발시키는 방식

문제 상황

해결책

누적 토큰 시나리오: 디버깅 루프

시나리오 A: 소규모 중간 리팩토링

시나리오 B: 중간 규모 + 상세 로그

시나리오 C: 매우 큰 코드베이스

입력 규모별 가능 작업 가이드

5K 토큰

20K 토큰

100K 토큰

코드 작업 토큰 절감 핵심 전략

1. Diff/Patch 중심 워크플로

2. 필요한 파일만 포함

3. 로그 발췌 정책

4. 반복 턴 최소화

5. 서브에이전트 사용 자제

Full File vs Diff 비교 요약

핵심 정리

토큰 폭발 주범

해결 전략

비용 감각

다음 편 예고

참고 자료

Claude Code 공식 문서

최적화 기술

커뮤니티 분석

'AI' 카테고리의 다른 글

티스토리툴바