MMLU や HumanEval の順位が毎週「最強モデル」を更新する一方、本番の開発者は別の表で意思決定しています。OpenRouter が週次(7 日ローリング)で集計する Token 呼び出し量です。支払った金額と消費した Token は嘘をつきません。ここに現れるのは実際の導入度と市場の評価であり、ラボの単発スコアではありません。
本記事は Mac 上で OpenClaw、Cursor、Claude Code などの Agent を編成する開発者と技術責任者向けです。2026年5月18日–24日の最新週次公開データ(集計締切日は OpenRouter 公式を参照)をもとに、28.9 兆 Token の週次格局、Top 10、DeepSeek マトリクスの優位、Anthropic のプレミアム逆説を整理し、週次で追跡・ルーティングを調整する六段階チェックリストを示します。読了後は、ベンチマークと請求のどちらを信じるべきか、中米モデルのシェアがどう分かれているか、Agent のデフォルトモデルを週次でどう更新するかが判断できる想定です。
01 Token 請求がベンチマークより信頼できる理由:三つの選定の罠
OpenRouter は世界最大級の中立 AI モデル API 集約プラットフォームの一つです。300 超のモデルと60 超のベンダーを単一インターフェースで束ね、OpenAI、Anthropic、Google、DeepSeek などを呼び出せます。Rankings ページは週次 Token スループット(入力+出力)で並べ替え、データは毎週更新され無料で閲覧できます。
- ベンチマークと本番の乖離:多くのランキングは単発推論の限界能力を測りますが、Agent ワークフローでは安定性、ツール呼び出し成功率、API 遅延、単価がより重要です。OpenRouter と a16z が共同公開した《2025 AI 利用レポート》(約 100 兆 Token の匿名メタデータに基づく)では、ベンチマークスコアと実際の市場シェアがほぼ逆相関であると指摘されています。開発者は推論コストを重視し、プログラミング系タスクの割合は 2025 年初の約 11% から 50% 超へ伸び、最大の単一用途になっています。
- キーノートの物語 vs ウォレットの投票:ベンダーの発表は「最強」を強調しますが、OpenRouter の週次榜は世界中の開発者が継続的に課金して呼び出した結果です。一年前の週次処理量は約 2.4 兆 Token、2026年5月下旬には 28.9 兆まで伸び、約 12 倍に成長しました。AI 利用は規模化の段階に入っており、請求の伸びはどのレビューよりもトレンドを語ります。
- 単一モデルだけを見る罠:型番ごとの順位はベンダー戦略を隠します。DeepSeek は V4-Flash、V4-Pro、V3.2 の三モデルが同週に Top 10 入りし、シリーズ合計の週次呼び出しは約 5.74 兆 Tokenです。単一競合を上回る「エコシステム上の支配」に近く、偶然のヒットではありません。
核心:Token 呼び出し量は AI の実導入と市場評価を測る体温計です。Agent とバッチ処理が主役の時代、週次の請求は MMLU よりデフォルトルート選定に効きます。
公式ランキングと集計口径は次のページで確認してください(公開後もリンクを開き直し、最新値を照合してください)。
02 2026年5月第三週:28.9 兆 Token と Top 10 週次ランキング
集計期間:2026年5月18日–5月24日(OpenRouter の週次 7 日ローリング口径)。世界の AI モデル週次 API 呼び出し総量は 28.9 兆 Token、前週比 +7.4%、五週連続の上昇です。
| 指標 | 数値 | 前週比 | 解釈 |
|---|---|---|---|
| 世界週次 Token 総量 | 28.9 兆 | +7.4% | 五週連続上昇、需要が継続 |
| 中国モデル週次呼び出し | 9.223 兆 | +19.89% | 四週連続で米国モデルを上回る |
| 米国モデル週次呼び出し | 4.93 兆 | +16.27% | 伸びは大きいがシェアは逆転 |
| 中国モデル流量シェア | 約 45%+ | — | 2025 年初は 2% 未満、二年で格局が再編 |
当週のモデル別 Top 10(週次 Token 量順。OpenRouter 公開榜と公開報道を相互参照。一部は推計・二次整理のため、利用前に公式を優先してください)。
| 順位 | モデル | ベンダー | 週次 Token 量 | 特徴 |
|---|---|---|---|---|
| 1 | DeepSeek-V4-Flash | DeepSeek(中国) | 3.43T(+66%) | Agent ワークフロー向け、極低単価 |
| 2 | 腾讯 Hy3 Preview | Tencent(中国) | 3.07T(+16%) | 無料終了後も高成長 |
| 3 | Claude Sonnet 4.6 | Anthropic(米国) | 1.35T | 百万コンテキスト、企業向けコーディング |
| 4 | DeepSeek-V3.2 | DeepSeek(中国) | 1.31T | 低価格ロングテール、ロールプレイ活発 |
| 5 | Owl Alpha | OpenRouter | 1.15T(+29%) | 無料 Agent 特化、百万コンテキスト |
| 6 | Gemini 3 Flash Preview | Google(米国) | 1.06T | マルチモーダル、学術・医療 |
| 7 | DeepSeek-V4-Pro | DeepSeek(中国) | 1.00T | マトリクス旗艦(系列合計約 5.74T) |
| 8 | MiniMax M2.7 | MiniMax(中国) | 806B | 長コンテキストのコスパ |
| 9 | Grok 4.1 Fast | xAI(米国) | 721B | 2M コンテキスト、法務 |
| 10 | Step 3.5 Flash | StepFun(中国) | 673B | 高速低価、バッチ処理 |
DeepSeek 多モデルマトリクス:三型が同時に Top 10 に入り、シリーズ週次合計は約 5.74 兆 Token(前週比約 +25.9%)。ベンダー次元では二週連続で Anthropic と Google を上回ります。Top 10 の半数超が中国モデルであり、2025 年初の中国流量シェアが 2% 未満だったことと比べ、極低コストの OSS 路線が世界の呼び出し格局を塗り替えています。
注:Kimi K2.6 は前週第 6 位だったが当週は圏外。V4-Pro の週量は一部報道で系列総量から Flash と V3.2 を差し引いた推計値です。数週経過後は上記 Rankings のリアルタイムデータを優先してください。
03 Token シェアとドル収入:Anthropic プレミアム逆説と三層市場
週次呼び出し量は「誰が最も使われているか」を示し、ドル収入シェアは「誰が最も稼いでいるか」を示します。二つの表を重ね合わせて初めて、AI 商業化の実態が見えます。
| ベンダー/層 | Token シェア動向 | ドル収入の特徴 | 典型シナリオ |
|---|---|---|---|
| Anthropic Claude | 約 12%(一年前は約 25%) | ドル収入シェア約 46% | 企業向け複雑推論、支払能力が高い |
| Google Gemini Flash | 中程度の流量 | 中程度の単価 | マルチモーダル、学術・医療 |
| DeepSeek / 腾讯 / MiniMax / StepFun | 高流量・急成長 | 極低価格主導 | Agent、コーディング、バッチパイプライン |
Anthropic プレミアム逆説:Claude Opus 4.6 など旗艦の月次収入は約 2,500 万ドル規模(公開財務・プラットフォーム観測口径)に達する一方、Token スループットは DeepSeek 系列のごく一部にとどまります。企業顧客は高品質推論に高単価を払い続けますが、流量の主導権は中国の極低価格モデルへ傾いています。これが「請求は嘘をつかない」第二の意味です。市場は同時に「能力プレミアム」と「規模のコスパ」を買っており、二者択一ではありません。
市場の三層構造:[高価値・低流量] Anthropic Opus → 複雑推論。[コスパ・中流量] Gemini Flash → マルチモーダル。[極低価格・高流量] DeepSeek マトリクス → Agent とバッチ。デフォルトルートは明確な一層に置き、混在によるコスト暴走を避けてください。
投資家にとって OpenRouter 週次榜は AI 商業化の進捗を測る窓になります(プラットフォーム評価で約 26x PS の議論もありました)。開発者には単一ベンダーに賭けない中立な温度計、研究機関には中米モデルシェアを追う最も直感的な公開系列の一つです。
04 開発者向け六段階:週次で OpenRouter 榜を追いルーティングを調整する
- 毎週月曜に Rankings を固定確認:OpenRouter Rankings を開き、世界週次総量・Top 10 の変動・前週比矢印を記録します。スクリーンショットや CSV をチーム Wiki に残し、記憶頼みの選定を避けてください。
- Token 列とドル列の二帳簿:OpenRouter Dashboard または自社課金で、モデルごとの週次 Token 量と週次ドル支出を分けて集計します。Token 比率が高いのに業務価値が低いモデルは、予備ルートへ降格を検討してください。
- シナリオを三層にマッピング:Agent/バッチのデフォルトは DeepSeek-V4-Flash など極低価格型。企業向け複雑推論は Claude Sonnet/Opus。マルチモーダルは Gemini Flash。Top 1 だけに全スタックを縛らないでください。
- 新規 Top 10 の「予兆モデル」を注視:Hy3 Preview、Owl Alpha など短期急上昇型は、無料終了後や Agent 特化リリース後も高成長を続けることが多く、A/B ルートの候補に向きます。即時の全量切替は避けてください。
- Mac Gateway 層でホットスワップ可能に:OpenClaw、Cursor、Claude Code ではモデル ID を環境変数または設定ファイルに書き、Skill へハードコードしません。Gateway を載せる macOS ホストは 7×24 オンラインが前提です。ノート PC のフタ閉じは Agent とルーティング戦略の同時切断につながります。
- 月次で「ベンチマーク vs 請求」のズレを振り返る:チームが重視する SWE-bench 系指標と OpenRouter 週次シェアを照合します。高スコアモデルの請求占比が続けて低ければ、本番はコストと遅延を優先しており、メディア見出しより請求を信じるべきです。
OPENROUTER_DEFAULT_MODEL=deepseek/deepseek-v4-flash
OPENROUTER_FALLBACK_MODEL=anthropic/claude-sonnet-4.6
OPENROUTER_WEEKLY_REVIEW_CRON=0 9 * * 1
curl -s https://openrouter.ai/api/v1/models | jq '.data[].id' | head
05 引用可能な数値、出典、CALMVPS への収束
- 集計期間:本文の核心データは OpenRouter 週次(7 日ローリング)口径、スナップショット締切 2026年5月24日。世界週次呼び出し 28.9 兆 Token、前週比 +7.4%。
- DeepSeek-V4-Flash:当週約 3.43 兆 Token、前週比約 +66%、モデル週次榜第 1 位(複数の財経メディアが OpenRouter/Bloomberg 口径を引用)。
- 中米比較:中国モデル週次 9.223 兆(+19.89%)対 米国 4.93 兆(+16.27%)。中国が四週連続第 1。
- DeepSeek 系列合計:約 5.74 兆 Token/週、前週比約 +25.9%。ベンダー次元で Anthropic と Google をリード。
- a16z × OpenRouter レポート:プログラミングタスク占比 50% 超。ベンチマークスコアと市場シェアの逆相関傾向(2025 年公開、引用時は原文を参照)。
OpenRouter 週次榜が示す真実は明快です。最も賢いモデルではなく、最も呼び出されるモデルが AI の実装を前に進めます。中国発 OSS は極低コストで世界の流量主導権を握り、Anthropic は高単価で企業の利益プールを守っています。ベンチマークだけを追うと、Agent 請求は二週間で制御不能になることがあります。
モデルルーティングを Mac 上で回すとき、代替案の弱点もはっきりしています。ノート PC のスリープで Gateway が切断される。Linux VPSではネイティブ macOS Agent ツールチェーンが動かない。仮想 Macは Metal や Xcode 経路で性能損失が出やすい。7×24 の安定稼働と月単位の柔軟な拡縮が必要な Agent 制御面と CI ノードには、CALMVPS ベアメタル Mac レンタルが専有 Apple Silicon、約 120 秒のプロビジョン、日/週/月課金を提供します。週次請求を信じてモデルを選びつつ、OpenClaw/Cursor の編成層をスリープしない本番級 macOS に載せられます。機種と料金は 料金ページ、リモート接続は ヘルプセンター、注文は Mac mini M4 注文 をご確認ください。