클로드 코드 토큰 경제학 시리즈 2편: Claude 모델 라인업 - Haiku, Sonnet, Opus 완벽 비교
💡 시리즈 소개: 이 시리즈는 Claude Code 사용자를 위한 토큰 경제학 가이드입니다. 1편에서 토큰의 기본 개념을 다뤘다면, 이번 편에서는 모델별 특성과 가격을 비교합니다.
모델 선택이 비용을 결정한다
동일한 텍스트를 입력해도 모델에 따라:
- 컨텍스트 한도가 다름 (단일 요청으로 가능한 작업 크기)
- 200K 초과 프리미엄 요율 적용 여부가 다름
- 출력 성향과 도구 사용 빈도가 달라 총 토큰 사용량이 변함
모델 선택의 본질은 '성능' 이전에 '운영 가능 영역'을 결정하는 것입니다.
2026년 2월 기준 모델 스냅샷
⚠️ 가격은 변동될 수 있으므로 실제 운영 전 최신 가격표 확인이 필요합니다.
전체 비교표
| 모델 | 포지셔닝 | 컨텍스트 | 입력 $/1M tok | 출력 $/1M tok |
|---|---|---|---|---|
| Haiku 4.5 | 저비용·고속 | - | $1 | $5 |
| Sonnet 4.5 | 균형형 | 200K | $3 (≤200K) / $6 (>200K) | $15 (≤200K) / $22.5 (>200K) |
| Opus 4.6 | 프론티어 | 최대 1M (베타) | $5 (≤200K) / $10 (>200K) | $25 (≤200K) / $37.5 (>200K) |
모델별 상세 분석
Haiku 4.5 - 속도와 비용 최적화
💰 가격: 입력 $1 / 출력 $5 (per 1M tokens)
🎯 용도: 고빈도 반복, 실시간 처리, 서브에이전트강점
- 가장 저렴한 비용
- 빠른 응답 속도
- 대량 워크로드에 최적
약점
- 고급 추론(extended thinking) 제약
- 복잡한 에이전트 작업에는 부적합
추천 사용 사례
- 짧은 Q&A 반복
- 간단한 코드 수정
- 분류/분석 작업
- 서브에이전트 구현
Sonnet 4.5 - 균형의 제왕
💰 가격: 입력 $3 / 출력 $15 (≤200K)
입력 $6 / 출력 $22.5 (>200K)
📏 컨텍스트: 200K tokens
📤 최대 출력: 64K tokens강점
- 에이전트/코딩/사실 기반 작업에 최적화
- 비용 대비 뛰어난 품질
- 도구 사용(tool use)에 특화
약점
- 200K 초과 시 프리미엄 요율 적용
- Opus 대비 추론 깊이 제한
추천 사용 사례
- 일반적인 코드 작업
- 문서 요약/리서치
- 중간 규모 프로젝트
- 비용과 품질 균형이 필요한 작업
Opus 4.6 - 프론티어 성능
💰 가격: 입력 $5 / 출력 $25 (≤200K)
입력 $10 / 출력 $37.5 (>200K)
📏 컨텍스트: 최대 1,000,000 tokens (1M, 베타)강점
- 최대 1M 토큰 컨텍스트 (베타)
- 심층 추론 (think longer)
- 대규모 코드베이스/장기 에이전트 작업
약점
- 가장 높은 비용
- 200K 초과 구간의 프리미엄이 특히 큼
- 1M 컨텍스트는 베타로 제한적 제공
추천 사용 사례
- 대규모 코드베이스 분석
- 복잡한 에이전트 워크플로
- 장기 작업/세션
- 최고 품질이 필요한 작업
200K 토큰 경계의 의미
가격 체제의 변곡점
200K 토큰은 단순한 기술적 한도가 아니라 가격 체제의 경계선입니다.
┌────────────────────────────────────────────┐
│ 200K 경계의 영향 │
├────────────────────────────────────────────┤
│ │
│ ≤200K 구간 │ >200K 구간 │
│ ────────────────── │ ────────────────── │
│ Sonnet: $3/$15 │ Sonnet: $6/$22.5 │
│ Opus: $5/$25 │ Opus: $10/$37.5 │
│ │ │
│ 일반 요율 │ 프리미엄 요율 │
│ │ (입력 2배, 출력 1.5배) │
└────────────────────────────────────────────┘Claude Code에서의 위험
Claude Code 환경에서는 컨텍스트가 쉽게 비대해집니다:
- 도구 정의 (수만 토큰)
- 파일 로딩 (포맷팅 오버헤드 포함)
- 테스트/빌드 로그
- 반복 히스토리 누적
⚠️ "사용자 입력이 150K여도 오버헤드까지 합치면 200K를 넘는" 상황이 현실적으로 발생합니다.
프롬프트 캐싱 비용
반복 세션에서 동일한 프롬프트를 재사용할 때 캐싱 비용이 별도로 존재합니다.
Sonnet 4.5 캐싱 비용
| 구간 | 캐시 쓰기 | 캐시 읽기 |
|---|---|---|
| ≤200K | $3.75/1M | $0.30/1M |
| >200K | $7.50/1M | $0.60/1M |
Opus 4.6 캐싱 비용
| 구간 | 캐시 쓰기 | 캐시 읽기 |
|---|---|---|
| ≤200K | $6.25/1M | $0.50/1M |
| >200K | $12.50/1M | $1.00/1M |
💡 캐시 읽기 비용이 매우 낮아, 반복 세션에서 최대 90% 비용 절감이 가능합니다.
배치 처리 할인
비동기/대량 처리 워크로드는 배치로 묶어 처리하면 최대 50% 절감이 가능합니다.
모델별 토큰 사용 행태 차이
출력 장황함 (Verbosity)
| 모델 | 출력 특성 |
|---|---|
| Haiku | 간결, 핵심만 |
| Sonnet | 균형적, 상세 설명 포함 |
| Opus | 심층 추론, 장황할 수 있음 |
Opus의 "think longer" 기능을 사용하면 추론 깊이가 증가하면서 출력 토큰이 크게 늘어날 수 있습니다.
도구 호출 빈도
| 모델 | 도구 사용 특성 |
|---|---|
| Haiku | 최소 호출, 빠른 완료 |
| Sonnet | 적극적 도구 활용 (tool-heavy) |
| Opus | 복잡한 멀티스텝 도구 체인 |
Sonnet이 agentic tool use에 최적화되어 있어, 더 자주 도구를 호출하고 더 많은 중간 기록을 남길 수 있습니다.
작업유형별 모델 추천
짧은 Q&A (≤5K 토큰)
추천: Haiku 4.5
이유: 저비용, 빠른 반복
비용: ~$0.006 (5K 입력 + 1K 출력 가정)문서 요약/리서치 (≈20K 토큰)
추천: Sonnet 4.5
이유: 비용 대비 품질 균형
비용: ~$0.12 (20K 입력 + 4K 출력 가정)중대형 코드 작업 (≈100K 토큰)
추천: Opus 4.6 + 토큰 절감 전략 필수
이유: 대규모 컨텍스트, 심층 추론 필요
비용: ~$0.75+ (100K 입력 + 20K 출력 가정)
주의: 200K 임계치 모니터링 필수모델 믹싱 전략
단일 모델만 사용하지 않고, 작업 특성에 따라 모델을 혼합하는 전략이 효과적입니다.
┌─────────────────────────────────────────┐
│ 모델 믹싱 예시 │
├─────────────────────────────────────────┤
│ │
│ 간단한 작업 ─────────► Haiku │
│ │ │
│ ▼ │
│ 중간 복잡도 ─────────► Sonnet │
│ │ │
│ ▼ │
│ 고난도/대규모 ────────► Opus │
│ │
└─────────────────────────────────────────┘핵심 정리
| 모델 | 핵심 특징 | 추천 용도 | 주의점 |
|---|---|---|---|
| Haiku | 최저가, 최고속 | 반복 작업, 서브에이전트 | 복잡한 추론 제한 |
| Sonnet | 균형, 도구 특화 | 일반 개발, 리서치 | 200K 초과 주의 |
| Opus | 최고 성능, 1M 컨텍스트 | 대규모 작업 | 비용 폭증 위험 |
다음 편 예고
3편: Claude Code의 토큰 비용 구조 - 숨겨진 비용의 정체
Claude Code에서 토큰이 실제로 어디서 발생하는지, 왜 예상보다 비용이 높은지 그 구조를 파헤칩니다.
참고 자료
Anthropic 공식 모델 페이지
- Claude Haiku - Haiku 모델 소개
- Claude Sonnet - Sonnet 모델 소개
- Claude Opus - Opus 모델 소개
- Claude Opus 4.6 발표 - Opus 4.6 출시 안내
가격 및 비용
- Anthropic Pricing - 공식 가격표
- Prompt Caching - 프롬프트 캐싱 소개
📚 클로드 코드 토큰 경제학 시리즈 | 2026년 2월
'AI' 카테고리의 다른 글
| 클로드 코드 토큰 경제학 시리즈 4편: 짧은 Q&A vs 긴 문서 요약 - 작업유형별 토큰 소모 분석 (0) | 2026.02.12 |
|---|---|
| 클로드 코드 토큰 경제학 시리즈 3편: Claude Code의 토큰 비용 구조 - 숨겨진 비용의 정체 (0) | 2026.02.12 |
| 클로드 코드 토큰 경제학 시리즈 1편: 토큰이란? AI 비용의 기본 단위 이해하기 (0) | 2026.02.12 |
| 클로드 코드 토큰 경제학 시리즈 소개 (0) | 2026.02.12 |
| ChatGPT 히스토리가 말해주는 다음 경쟁의 규칙 — ChatGPT 기술 제품 조직 12/12 (0) | 2026.02.09 |
