클로드 코드 토큰 경제학 시리즈 2편: Claude 모델 라인업 - Haiku, Sonnet, Opus 완벽 비교

💡 시리즈 소개: 이 시리즈는 Claude Code 사용자를 위한 토큰 경제학 가이드입니다. 1편에서 토큰의 기본 개념을 다뤘다면, 이번 편에서는 모델별 특성과 가격을 비교합니다.

모델 선택이 비용을 결정한다

동일한 텍스트를 입력해도 모델에 따라:

컨텍스트 한도가 다름 (단일 요청으로 가능한 작업 크기)
200K 초과 프리미엄 요율 적용 여부가 다름
출력 성향과 도구 사용 빈도가 달라 총 토큰 사용량이 변함

모델 선택의 본질은 '성능' 이전에 '운영 가능 영역'을 결정하는 것입니다.

2026년 2월 기준 모델 스냅샷

⚠️ 가격은 변동될 수 있으므로 실제 운영 전 최신 가격표 확인이 필요합니다.

전체 비교표

모델	포지셔닝	컨텍스트	입력 $/1M tok	출력 $/1M tok
Haiku 4.5	저비용·고속	-	$1	$5
Sonnet 4.5	균형형	200K	$3 (≤200K) / $6 (>200K)	$15 (≤200K) / $22.5 (>200K)
Opus 4.6	프론티어	최대 1M (베타)	$5 (≤200K) / $10 (>200K)	$25 (≤200K) / $37.5 (>200K)

모델별 상세 분석

Haiku 4.5 - 속도와 비용 최적화

💰 가격: 입력 $1 / 출력 $5 (per 1M tokens)
🎯 용도: 고빈도 반복, 실시간 처리, 서브에이전트

강점

가장 저렴한 비용
빠른 응답 속도
대량 워크로드에 최적

약점

고급 추론(extended thinking) 제약
복잡한 에이전트 작업에는 부적합

추천 사용 사례

짧은 Q&A 반복
간단한 코드 수정
분류/분석 작업
서브에이전트 구현

Sonnet 4.5 - 균형의 제왕

💰 가격: 입력 $3 / 출력 $15 (≤200K)
       입력 $6 / 출력 $22.5 (>200K)
📏 컨텍스트: 200K tokens
📤 최대 출력: 64K tokens

강점

에이전트/코딩/사실 기반 작업에 최적화
비용 대비 뛰어난 품질
도구 사용(tool use)에 특화

약점

200K 초과 시 프리미엄 요율 적용
Opus 대비 추론 깊이 제한

추천 사용 사례

일반적인 코드 작업
문서 요약/리서치
중간 규모 프로젝트
비용과 품질 균형이 필요한 작업

Opus 4.6 - 프론티어 성능

💰 가격: 입력 $5 / 출력 $25 (≤200K)
       입력 $10 / 출력 $37.5 (>200K)
📏 컨텍스트: 최대 1,000,000 tokens (1M, 베타)

강점

최대 1M 토큰 컨텍스트 (베타)
심층 추론 (think longer)
대규모 코드베이스/장기 에이전트 작업

약점

가장 높은 비용
200K 초과 구간의 프리미엄이 특히 큼
1M 컨텍스트는 베타로 제한적 제공

추천 사용 사례

대규모 코드베이스 분석
복잡한 에이전트 워크플로
장기 작업/세션
최고 품질이 필요한 작업

200K 토큰 경계의 의미

가격 체제의 변곡점

200K 토큰은 단순한 기술적 한도가 아니라 가격 체제의 경계선입니다.

┌────────────────────────────────────────────┐
│              200K 경계의 영향               │
├────────────────────────────────────────────┤
│                                            │
│  ≤200K 구간          │   >200K 구간        │
│  ──────────────────  │  ──────────────────  │
│  Sonnet: $3/$15      │  Sonnet: $6/$22.5   │
│  Opus: $5/$25        │  Opus: $10/$37.5    │
│                      │                     │
│  일반 요율           │  프리미엄 요율       │
│                      │  (입력 2배, 출력 1.5배) │
└────────────────────────────────────────────┘

Claude Code에서의 위험

Claude Code 환경에서는 컨텍스트가 쉽게 비대해집니다:

도구 정의 (수만 토큰)
파일 로딩 (포맷팅 오버헤드 포함)
테스트/빌드 로그
반복 히스토리 누적

⚠️ "사용자 입력이 150K여도 오버헤드까지 합치면 200K를 넘는" 상황이 현실적으로 발생합니다.

프롬프트 캐싱 비용

반복 세션에서 동일한 프롬프트를 재사용할 때 캐싱 비용이 별도로 존재합니다.

Sonnet 4.5 캐싱 비용

구간	캐시 쓰기	캐시 읽기
≤200K	$3.75/1M	$0.30/1M
>200K	$7.50/1M	$0.60/1M

Opus 4.6 캐싱 비용

구간	캐시 쓰기	캐시 읽기
≤200K	$6.25/1M	$0.50/1M
>200K	$12.50/1M	$1.00/1M

💡 캐시 읽기 비용이 매우 낮아, 반복 세션에서 최대 90% 비용 절감이 가능합니다.

배치 처리 할인

비동기/대량 처리 워크로드는 배치로 묶어 처리하면 최대 50% 절감이 가능합니다.

모델별 토큰 사용 행태 차이

출력 장황함 (Verbosity)

모델	출력 특성
Haiku	간결, 핵심만
Sonnet	균형적, 상세 설명 포함
Opus	심층 추론, 장황할 수 있음

Opus의 "think longer" 기능을 사용하면 추론 깊이가 증가하면서 출력 토큰이 크게 늘어날 수 있습니다.

도구 호출 빈도

모델	도구 사용 특성
Haiku	최소 호출, 빠른 완료
Sonnet	적극적 도구 활용 (tool-heavy)
Opus	복잡한 멀티스텝 도구 체인

Sonnet이 agentic tool use에 최적화되어 있어, 더 자주 도구를 호출하고 더 많은 중간 기록을 남길 수 있습니다.

작업유형별 모델 추천

짧은 Q&A (≤5K 토큰)

추천: Haiku 4.5
이유: 저비용, 빠른 반복
비용: ~$0.006 (5K 입력 + 1K 출력 가정)

문서 요약/리서치 (≈20K 토큰)

추천: Sonnet 4.5
이유: 비용 대비 품질 균형
비용: ~$0.12 (20K 입력 + 4K 출력 가정)

중대형 코드 작업 (≈100K 토큰)

추천: Opus 4.6 + 토큰 절감 전략 필수
이유: 대규모 컨텍스트, 심층 추론 필요
비용: ~$0.75+ (100K 입력 + 20K 출력 가정)
주의: 200K 임계치 모니터링 필수

모델 믹싱 전략

단일 모델만 사용하지 않고, 작업 특성에 따라 모델을 혼합하는 전략이 효과적입니다.

┌─────────────────────────────────────────┐
│           모델 믹싱 예시                 │
├─────────────────────────────────────────┤
│                                         │
│  간단한 작업 ─────────► Haiku          │
│       │                                 │
│       ▼                                 │
│  중간 복잡도 ─────────► Sonnet         │
│       │                                 │
│       ▼                                 │
│  고난도/대규모 ────────► Opus           │
│                                         │
└─────────────────────────────────────────┘

핵심 정리

모델	핵심 특징	추천 용도	주의점
Haiku	최저가, 최고속	반복 작업, 서브에이전트	복잡한 추론 제한
Sonnet	균형, 도구 특화	일반 개발, 리서치	200K 초과 주의
Opus	최고 성능, 1M 컨텍스트	대규모 작업	비용 폭증 위험

다음 편 예고

3편: Claude Code의 토큰 비용 구조 - 숨겨진 비용의 정체

Claude Code에서 토큰이 실제로 어디서 발생하는지, 왜 예상보다 비용이 높은지 그 구조를 파헤칩니다.

참고 자료

Anthropic 공식 모델 페이지

Claude Haiku - Haiku 모델 소개
Claude Sonnet - Sonnet 모델 소개
Claude Opus - Opus 모델 소개
Claude Opus 4.6 발표 - Opus 4.6 출시 안내

가격 및 비용

Anthropic Pricing - 공식 가격표
Prompt Caching - 프롬프트 캐싱 소개

📚 클로드 코드 토큰 경제학 시리즈 | 2026년 2월

'AI' 카테고리의 다른 글

클로드 코드 토큰 경제학 시리즈 4편: 짧은 Q&A vs 긴 문서 요약 - 작업유형별 토큰 소모 분석 (0)	2026.02.12
클로드 코드 토큰 경제학 시리즈 3편: Claude Code의 토큰 비용 구조 - 숨겨진 비용의 정체 (0)	2026.02.12
클로드 코드 토큰 경제학 시리즈 1편: 토큰이란? AI 비용의 기본 단위 이해하기 (0)	2026.02.12
클로드 코드 토큰 경제학 시리즈 소개 (0)	2026.02.12
ChatGPT 히스토리가 말해주는 다음 경쟁의 규칙 — ChatGPT 기술 제품 조직 12/12 (0)	2026.02.09

클로드 코드 토큰 경제학 시리즈 2편: Claude 모델 라인업 - Haiku, Sonnet, Opus 완벽 비교

모델 선택이 비용을 결정한다

2026년 2월 기준 모델 스냅샷

전체 비교표

모델별 상세 분석

Haiku 4.5 - 속도와 비용 최적화

Sonnet 4.5 - 균형의 제왕

Opus 4.6 - 프론티어 성능

200K 토큰 경계의 의미

가격 체제의 변곡점

Claude Code에서의 위험

프롬프트 캐싱 비용

Sonnet 4.5 캐싱 비용

Opus 4.6 캐싱 비용

배치 처리 할인

모델별 토큰 사용 행태 차이

출력 장황함 (Verbosity)

도구 호출 빈도

작업유형별 모델 추천

짧은 Q&A (≤5K 토큰)

문서 요약/리서치 (≈20K 토큰)

중대형 코드 작업 (≈100K 토큰)

모델 믹싱 전략

핵심 정리

다음 편 예고

참고 자료

Anthropic 공식 모델 페이지

가격 및 비용

'AI' 카테고리의 다른 글

티스토리툴바