MMLU·HumanEval 순위가 매주 「최강 모델」을 갱신하는 동안, 프로덕션 개발자는 다른 표에 표를 던집니다. OpenRouter가 주간(7일 롤링)으로 집계하는 Token 호출량입니다. 지출한 금액과 소비한 Token은 거짓말하지 않습니다. 여기서 드러나는 것은 실제 도입도와 시장의 평가이며, 실험실 단발 점수가 아닙니다.
이 글은 Mac에서 OpenClaw, Cursor, Claude Code 등 Agent를 편성하는 개발자와 기술 책임자를 위합니다. 2026년 5월 18–24일 최신 주간 공개 데이터(집계 기준일은 OpenRouter 공식 참조)를 바탕으로 28.9조 Token 주간 구도, Top 10, DeepSeek 매트릭스 우위, Anthropic 프리미엄 역설을 정리하고, 주간 추적·라우팅 조정 6단계 체크리스트를 제공합니다. 읽은 뒤에는 벤치마크와 청구 중 무엇을 믿을지, 중·미 모델 점유가 어떻게 갈리는지, Agent 기본 모델을 주 단위로 어떻게 갱신할지 판단할 수 있어야 합니다.
01 Token 청구가 벤치마크 순위보다 신뢰할 만한 이유: 세 가지 선정 함정
OpenRouter는 세계 최대급 중립 AI 모델 API 집약 플랫폼 중 하나입니다. 300개 이상 모델과 60개 이상 벤더를 단일 인터페이스로 묶어 OpenAI, Anthropic, Google, DeepSeek 등을 호출합니다. Rankings 페이지는 주간 Token 처리량(입력+출력)으로 정렬하며, 데이터는 매주 갱신되어 무료로 열람할 수 있습니다.
- 벤치마크와 프로덕션 괴리: 많은 순위는 단발 추론의 한계 능력을 측정하지만, Agent 워크플로에서는 안정성, 도구 호출 성공률, API 지연, 단가가 더 중요합니다. OpenRouter와 a16z가 공동 발표한 《2025 AI 이용 보고서》(약 100조 Token 익명 메타데이터 기반)는 벤치마크 점수와 실제 시장 점유가 거의 역상관이라고 지적합니다. 개발자는 추론 비용을 중시하며, 프로그래밍 작업 비중은 2025년 초 약 11%에서 50% 초과로 늘어 최대 단일 용도가 되었습니다.
- 키노트 서사 vs 지갑 투표: 벤더 발표는 「최강」을 강조하지만, OpenRouter 주간 순위는 전 세계 개발자가 지속 과금하며 호출한 결과입니다. 1년 전 주간 처리량은 약 2.4조 Token, 2026년 5월 하순에는 28.9조까지 성장해 약 12배입니다. AI 이용은 규모화 단계에 들어섰으며, 청구 증가율이 어떤 리뷰보다 추세를 말해 줍니다.
- 단일 모델만 보는 함정: 모델별 순위는 벤더 전략을 가립니다. DeepSeek는 V4-Flash, V4-Pro, V3.2 세 모델이 같은 주에 Top 10에 들었고, 시리즈 합산 주간 호출은 약 5.74조 Token입니다. 단일 경쟁사를 넘는 「생태계 지배」에 가깝고, 우연한 히트가 아닙니다.
핵심: Token 호출량은 AI 실도입과 시장 평가를 재는 체온계입니다. Agent와 배치 처리가 주역인 시대, 주간 청구가 MMLU보다 기본 라우트 선정에 더 유효합니다.
공식 순위와 집계 기준은 아래 페이지에서 확인하세요(게시 후에도 링크를 다시 열어 최신 수치를 대조하세요).
02 2026년 5월 셋째 주: 28.9조 Token과 Top 10 주간 순위
집계 기간: 2026년 5월 18–24일(OpenRouter 주간 7일 롤링 기준). 글로벌 AI 모델 주간 API 호출 총량은 28.9조 Token, 전주 대비 +7.4%, 5주 연속 상승입니다.
| 지표 | 수치 | 전주 대비 | 해석 |
|---|---|---|---|
| 글로벌 주간 Token 총량 | 28.9조 | +7.4% | 5주 연속 상승, 수요 지속 |
| 중국 모델 주간 호출 | 9.223조 | +19.89% | 4주 연속 미국 모델 상회 |
| 미국 모델 주간 호출 | 4.93조 | +16.27% | 성장은 크나 점유는 역전 |
| 중국 모델 트래픽 비중 | 약 45%+ | — | 2025년 초 2% 미만, 2년 만에 판도 재편 |
해당 주 모델별 Top 10(주간 Token량 순. OpenRouter 공개 순위와 공개 보도를 상호 참조. 일부는 추정·2차 정리이므로 사용 전 공식을 우선하세요).
| 순위 | 모델 | 벤더 | 주간 Token량 | 특징 |
|---|---|---|---|---|
| 1 | DeepSeek-V4-Flash | DeepSeek(중국) | 3.43T(+66%) | Agent 워크플로 우선, 극저단가 |
| 2 | 腾讯 Hy3 Preview | Tencent(중국) | 3.07T(+16%) | 무료 종료 후에도 고성장 |
| 3 | Claude Sonnet 4.6 | Anthropic(미국) | 1.35T | 백만 컨텍스트, 기업 코딩 |
| 4 | DeepSeek-V3.2 | DeepSeek(중국) | 1.31T | 저가 롱테일, 롤플레이 활발 |
| 5 | Owl Alpha | OpenRouter | 1.15T(+29%) | 무료 Agent 특화, 백만 컨텍스트 |
| 6 | Gemini 3 Flash Preview | Google(미국) | 1.06T | 멀티모달, 학술·의료 |
| 7 | DeepSeek-V4-Pro | DeepSeek(중국) | 1.00T | 매트릭스 플래그십(시리즈 합계 약 5.74T) |
| 8 | MiniMax M2.7 | MiniMax(중국) | 806B | 장문 컨텍스트 가성비 |
| 9 | Grok 4.1 Fast | xAI(미국) | 721B | 2M 컨텍스트, 법무 |
| 10 | Step 3.5 Flash | StepFun(중국) | 673B | 고속 저가, 배치 처리 |
DeepSeek 다모델 매트릭스: 세 모델이 동시에 Top 10에 진입했고, 시리즈 주간 합계는 약 5.74조 Token(전주 대비 약 +25.9%). 벤더 차원에서 2주 연속 Anthropic·Google을 앞섭니다. Top 10의 절반 이상이 중국 모델이며, 2025년 초 중국 트래픽 비중이 2% 미만이던 것과 비교하면, 극저비용 OSS 노선이 글로벌 호출 판도를 바꿨습니다.
참고: Kimi K2.6은 전주 6위였으나 해당 주 순위권 밖. V4-Pro 주간량은 일부 보도에서 시리즈 총량에서 Flash·V3.2를 뺀 추정치입니다. 수주가 지난 뒤에는 위 Rankings 실시간 데이터를 우선하세요.
03 Token 점유 vs 달러 수익: Anthropic 프리미엄 역설과 3층 시장
주간 호출량은 「누가 가장 많이 쓰이는가」를, 달러 수익 점유는 「누가 가장 많이 버는가」를 보여 줍니다. 두 표를 겹쳐야 AI 상업화의 실상이 드러납니다.
| 벤더/층 | Token 점유 추세 | 달러 수익 특성 | 전형 시나리오 |
|---|---|---|---|
| Anthropic Claude | 약 12%(1년 전 약 25%) | 달러 수익 점유 약 46% | 기업 복잡 추론, 지불 능력 높음 |
| Google Gemini Flash | 중간 트래픽 | 중간 단가 | 멀티모달, 학술·의료 |
| DeepSeek / 腾讯 / MiniMax / StepFun | 고트래픽·급성장 | 극저가 주도 | Agent, 코딩, 배치 파이프라인 |
Anthropic 프리미엄 역설: Claude Opus 4.6 등 플래그십의 월 수익은 약 2,500만 달러 규모(공개 재무·플랫폼 관측 기준)에 달하지만, Token 처리량은 DeepSeek 시리즈의 극히 일부에 머뭅니다. 기업 고객은 고품질 추론에 고단가를 지불하지만, 트래픽 주도권은 중국의 극저가 모델로 기울고 있습니다. 이것이 「청구는 거짓말하지 않는다」의 두 번째 의미입니다. 시장은 「능력 프리미엄」과 「규모 가성비」를 동시에 사며, 양자택일이 아닙니다.
시장 3층 구조: [고가치·저트래픽] Anthropic Opus → 복잡 추론. [가성비·중트래픽] Gemini Flash → 멀티모달. [극저가·고트래픽] DeepSeek 매트릭스 → Agent·배치. 기본 라우트는 한 층에 명확히 두고, 혼용으로 비용이 폭주하지 않게 하세요.
투자자에게 OpenRouter 주간 순위는 AI 상업화 진척을 보는 창입니다(플랫폼 밸류에이션에서 약 26x PS 논의도 있었습니다). 개발자에게는 단일 벤더에 올인하지 않을 때의 중립 온도계, 연구기관에게는 중·미 모델 점유를 추적하는 가장 직관적인 공개 시계열 중 하나입니다.
04 개발자 6단계: 주간으로 OpenRouter 순위를 추적하고 모델 라우팅을 조정합니다
- 매주 월요일 Rankings 고정 확인: OpenRouter Rankings를 열어 글로벌 주간 총량, Top 10 변동, 전주 대비 화살표를 기록합니다. 스크린샷이나 CSV를 팀 Wiki에 남겨 기억에 의존한 선정을 피하세요.
- Token 열과 달러 열 이중 장부: OpenRouter Dashboard 또는 자체 과금에서 모델별 주간 Token량과 주간 달러 지출을 분리 집계합니다. Token 비중은 높은데 업무 가치가 낮은 모델은 예비 라우트로 강등을 검토하세요.
- 시나리오를 3층에 매핑: Agent·배치 기본은 DeepSeek-V4-Flash 등 극저가형. 기업 복잡 추론은 Claude Sonnet/Opus. 멀티모달은 Gemini Flash. 1위 모델 하나에 전 스택을 묶지 마세요.
- 신규 Top 10 「예감 모델」 주시: Hy3 Preview, Owl Alpha 등 단기 급상승형은 무료 종료 후나 Agent 특화 출시 뒤에도 고성장을 이어가는 경우가 많아 A/B 라우트 후보에 적합합니다. 즉시 전량 전환은 피하세요.
- Mac Gateway 계층에서 핫스왑 가능하게: OpenClaw, Cursor, Claude Code에서는 모델 ID를 환경 변수나 설정 파일에 두고 Skill에 하드코딩하지 마세요. Gateway가 올라가는 macOS 호스트는 7×24 온라인이 전제입니다. 노트북 덮개 닫힘은 Agent와 라우팅 전략이 동시에 끊깁니다.
- 월 1회 「벤치마크 vs 청구」 편차 회고: 팀이 중시하는 SWE-bench류 지표와 OpenRouter 주간 점유를 대조합니다. 고득점 모델의 청구 비중이 계속 낮다면 프로덕션은 비용·지연을 우선하므로, 헤드라인보다 청구를 믿어야 합니다.
OPENROUTER_DEFAULT_MODEL=deepseek/deepseek-v4-flash
OPENROUTER_FALLBACK_MODEL=anthropic/claude-sonnet-4.6
OPENROUTER_WEEKLY_REVIEW_CRON=0 9 * * 1
curl -s https://openrouter.ai/api/v1/models | jq '.data[].id' | head
05 인용 가능한 수치, 출처, CALMVPS로의 수렴
- 집계 기간: 본문 핵심 데이터는 OpenRouter 주간(7일 롤링) 기준, 스냅샷 마감 2026년 5월 24일. 글로벌 주간 호출 28.9조 Token, 전주 대비 +7.4%.
- DeepSeek-V4-Flash: 해당 주 약 3.43조 Token, 전주 대비 약 +66%, 모델 주간 1위(다수 재경 매체가 OpenRouter/Bloomberg 기준 인용).
- 중·미 비교: 중국 모델 주간 9.223조(+19.89%) vs 미국 4.93조(+16.27%). 중국 4주 연속 1위.
- DeepSeek 시리즈 합계: 약 5.74조 Token/주, 전주 대비 약 +25.9%. 벤더 차원에서 Anthropic·Google 선두.
- a16z × OpenRouter 보고서: 프로그래밍 작업 비중 50% 초과. 벤치마크 점수와 시장 점유 역상관 경향(2025년 공개, 인용 시 원문 참조).
OpenRouter 주간 순위가 말하는 진실은 분명합니다. 가장 똑똑한 모델이 아니라 가장 호출되는 모델이 AI 실전 도입을 앞당깁니다. 중국 OSS는 극저비용으로 글로벌 트래픽 주도권을 잡고, Anthropic은 고단가로 기업 이익 풀을 지킵니다. 벤치마크만 쫓으면 Agent 청구가 2주 안에 통제 불능이 될 수 있습니다.
모델 라우팅을 Mac에서 돌릴 때 대안의 약점도 분명합니다. 노트북 슬립으로 Gateway가 끊깁니다. Linux VPS에서는 네이티브 macOS Agent 툴체인이 돌지 않습니다. 가상 Mac은 Metal·Xcode 경로에서 성능 손실이 나기 쉽습니다. 7×24 안정 가동과 월 단위 탄력 확장이 필요한 Agent 제어 평면과 CI 노드에는 CALMVPS 베어메탈 Mac 렌탈이 전용 Apple Silicon, 약 120초 프로비저닝, 일/주/월 과금을 제공합니다. 주간 청구를 믿고 모델을 고르면서 OpenClaw/Cursor 편성 계층을 슬립 없는 프로덕션급 macOS에 올릴 수 있습니다. 기종·가격은 가격 페이지, 원격 접속은 고객 센터, 주문은 Mac mini M4 주문에서 확인하세요.