Пока MMLU и HumanEval каждую неделю объявляют «сильнейшую модель», разработчики в продакшене голосуют иначе — по объёму токенов, который OpenRouter публикует в скользящих семидневных окнах. Потраченные доллары и прогнанные токены измеряют реальное внедрение и рыночное признание, а не разовый лабораторный прогон.
Статья для команд, которые на Mac оркестрируют OpenClaw, Cursor или Claude Code. На основе открытых данных за 18–24 мая 2026 (актуальная дата на сайте OpenRouter) разбираем 28,9 трлн недельных токенов, Top 10, матрицу DeepSeek и парадокс Anthropic, плюс чеклист из шести шагов для еженедельной настройки маршрутизации. После прочтения будет ясно: доверять бенчмаркам или счёту, как делятся китайские и американские модели и как обновлять модели по умолчанию каждую неделю.
01 Почему токен-счёт надёжнее бенчмарков: три ошибки выбора
OpenRouter — один из крупнейших нейтральных агрегаторов API: более 300 моделей, 60+ поставщиков, единый интерфейс к OpenAI, Anthropic, Google, DeepSeek и другим. Страница Rankings сортирует по недельному токен-потоку (вход + выход) и обновляется еженедельно — данные открыты.
- Бенчмарки vs продакшен: рейтинги часто тестируют разовый инференс. Agent-воркфлоу зависят от стабильности, успеха tool-call, задержки API и цены за миллион токенов. Совместный отчёт OpenRouter и a16z («2025 AI Usage Report», ~100 трлн токенов анонимизированных метаданных) показывает: баллы бенчмарков и доля рынка почти обратно коррелируют — разработчики оптимизируют стоимость. Доля задач программирования выросла с ~11 % в начале 2025 до свыше 50 %.
- Презентация vs голос кошелька: вендоры продают «самый сильный», OpenRouter отражает, за что команды платят постоянно. Год назад платформа обрабатывала ~2,4 трлн токенов в неделю; к концу мая 2026 — 28,9 трлн, рост примерно в 12 раз.
- Одна модель vs матрица: место в рейтинге скрывает продуктовую стратегию. DeepSeek одновременно вывел в Top 10 V4-Flash, V4-Pro и V3.2; серия суммарно ~5,74 трлн токенов — доминирование экосистемы, а не случайный хит.
Главный тезис: объём токенов — термометр реального внедрения ИИ. В эпоху агентов и batch-обработки недельный счёт лучше направляет default-маршрутизацию, чем балл MMLU.
Официальные рейтинги и методология:
02 18–24 мая 2026: 28,9 трлн токенов и Top 10 моделей
Период: 18–24 мая 2026 (семидневное скользящее окно OpenRouter). Глобальный недельный объём API-токенов — 28,9 трлн, +7,4 % к предыдущей неделе, пятый рост подряд.
| Показатель | Значение | Нед./нед. | Интерпретация |
|---|---|---|---|
| Глобальный недельный объём | 28,9 трлн | +7,4 % | Пятая неделя роста подряд |
| Китайские модели | 9,223 трлн | +19,89 % | Четвёртая неделя впереди США |
| Американские модели | 4,93 трлн | +16,27 % | Рост сильный, доля снижается |
| Доля трафика Китая | ~45 %+ | — | Начало 2025 — менее 2 % |
Top 10 по недельным токенам (перекрёстная проверка OpenRouter и открытых источников; перед использованием сверить на сайте):
| Место | Модель | Вендор | Токены/нед. | Профиль |
|---|---|---|---|---|
| 1 | DeepSeek-V4-Flash | DeepSeek (Китай) | 3,43T (+66 %) | Agent-воркфлоу, минимальная цена |
| 2 | Tencent Hy3 Preview | Tencent (Китай) | 3,07T (+16 %) | Рост после бесплатного периода |
| 3 | Claude Sonnet 4.6 | Anthropic (США) | 1,35T | 1M контекст, enterprise-код |
| 4 | DeepSeek-V3.2 | DeepSeek (Китай) | 1,31T | Дешёвый long tail |
| 5 | Owl Alpha | OpenRouter | 1,15T (+29 %) | Бесплатно, agent-фокус, 1M |
| 6 | Gemini 3 Flash Preview | Google (США) | 1,06T | Мультимодальность, наука/медицина |
| 7 | DeepSeek-V4-Pro | DeepSeek (Китай) | 1,00T | Флагман матрицы (~5,74T серия) |
| 8 | MiniMax M2.7 | MiniMax (Китай) | 806B | Длинный контекст, цена/качество |
| 9 | Grok 4.1 Fast | xAI (США) | 721B | 2M контекст, правовые сценарии |
| 10 | Step 3.5 Flash | StepFun (Китай) | 673B | Быстро, дёшево, batch |
Матрица DeepSeek: три варианта в Top 10, суммарно ~5,74 трлн токенов (+25,9 % нед./нед.), вторую неделю подряд впереди Anthropic и Google на уровне вендора. Больше половины Top 10 — китайские модели; при доле трафика Китая менее 2 % в начале 2025 это структурный сдвиг в пользу дешёвого open source.
Примечание: Kimi K2.6 был 6-м на прошлой неделе и выпал из Top 10; V4-Pro частично оценён как сумма серии минус Flash и V3.2. Актуальные цифры — на странице Rankings.
03 Доля токенов vs доход в USD: парадокс Anthropic и три слоя рынка
Недельные токены отвечают на вопрос «кого вызывают чаще», доли в долларах — «кто зарабатывает больше». Только вместе видна коммерческая структура.
| Вендор / слой | Тренд токенов | Доход USD | Типичные сценарии |
|---|---|---|---|
| Anthropic Claude | ~12 % (год назад ~25 %) | ~46 % дохода в USD | Сложный enterprise-reasoning |
| Google Gemini Flash | Средний трафик | Средняя цена | Мультимодальность, наука, медицина |
| DeepSeek / Tencent / MiniMax / StepFun | Высокий трафик, быстрый рост | Экстремально низкие цены | Агенты, код, batch-пайплайны |
Парадокс Anthropic: флагманы вроде Claude Opus 4.6 могут приносить порядка 25 млн USD в месяц (публичные финансовые и платформенные оценки), при объёме токенов на порядки меньше серии DeepSeek. Enterprise-клиенты платят премию за качество, но центр тяжести трафика смещается к ультрадешёвым китайским моделям. Рынок одновременно покупает «премию за способности» и «масштабную эффективность».
Три слоя: [высокая ценность · малый трафик] Anthropic Opus для тяжёлого reasoning; [цена/качество · средний трафик] Gemini Flash для мультимодальности; [минимальная цена · высокий трафик] матрица DeepSeek для агентов и batch. Default-маршрут должен явно попадать в один слой — смешение без политики раздувает счёт.
Для инвесторов недельный рейтинг — окно в коммерциализацию ИИ (обсуждались оценки порядка 26× PS). Для разработчиков — нейтральный термометр без vendor lock-in. Для исследований — одна из самых прозрачных публичных серий по доле Китай/США.
04 Шесть шагов: еженедельно проверять OpenRouter и настраивать маршрут
- Каждый понедельник открывать Rankings: фиксировать глобальный недельный объём, изменения Top 10 и стрелки нед./нед.; сохранять скриншот или экспорт в wiki команды.
- Разделять колонки токенов и USD: в dashboard OpenRouter или собственном биллинге вести токены/неделю и USD/неделю по моделям. Высокая доля токенов при низкой бизнес-ценности — перевод на fallback.
- Маппить три слоя на сценарии: agent/batch по умолчанию DeepSeek-V4-Flash; сложный enterprise — Claude Sonnet/Opus; мультимодальность — Gemini Flash. Не ставить всё на первое место рейтинга.
- Следить за новыми Top 10: Hy3 Preview, Owl Alpha — часто сильный рост после конца free tier или agent-специализации; кандидаты для A/B, не мгновенная полная замена.
- Hot-swap на уровне Mac gateway: ID моделей в переменных окружения или конфиге OpenClaw, не в skills. Хост macOS нужен 7×24 — спящий MacBook рвёт и агента, и маршрут.
- Раз в месяц сверять benchmark и счёт: сопоставить SWE-bench и недельные доли OpenRouter. Если дорогая модель недопредставлена в счёте, в продакшене важнее стоимость и задержка — доверяйте счёту, а не заголовкам.
OPENROUTER_DEFAULT_MODEL=deepseek/deepseek-v4-flash
OPENROUTER_FALLBACK_MODEL=anthropic/claude-sonnet-4.6
OPENROUTER_WEEKLY_REVIEW_CRON=0 9 * * 1
curl -s https://openrouter.ai/api/v1/models | jq '.data[].id' | head
05 Цитируемые данные, источники и CALMVPS
- Период: скользящее окно 7 дней, снимок до 24 мая 2026; глобально 28,9 трлн токенов, +7,4 % нед./нед.
- DeepSeek-V4-Flash: ~3,43 трлн, +66 %, 1-е место по моделям (финансовые СМИ цитируют OpenRouter/Bloomberg).
- Китай vs США: 9,223 трлн (+19,89 %) против 4,93 трлн (+16,27 %) — Китай четвёртую неделю первый.
- Серия DeepSeek: ~5,74 трлн/неделю, +25,9 %, впереди Anthropic и Google на уровне вендора.
- a16z × OpenRouter: код > 50 % трафика; балл бенчмарка и доля рынка тенденциозно обратны (отчёт 2025, сверить оригинал).
Вывод недельного рейтинга прямолинеен: важно не кто умнее в лаборатории, а кого чаще вызывают — это двигает ИИ в продакшене. Китайский open source забирает трафик минимальной ценой; Anthropic удерживает enterprise-маржу. Гонка только за бенчмарками часто раздувает agent-счёт за две недели.
На Mac типичные альтернативы ломаются структурно: сон MacBook рвёт gateway; Linux VPS без нативных macOS agent-инструментов; виртуальный Mac с потерями Metal/Xcode. Для стабильности 7×24 и помесячного масштабирования аренда bare-metal Mac CALMVPS даёт выделенный Apple Silicon, доставку ~120 с и оплату день/неделя/месяц — OpenClaw и Cursor на бодрствующем продакшен-macOS, пока вы маршрутизируете по недельному счёту. Цены: цены аренды Mac mini M4, помощь: центр помощи, заказ: оформить заказ Mac mini M4.