Im Juni 2026 sind kostenlose KI-Coding-Tokens reichlicher verfügbar, als die meisten Entwickler annehmen. Ein Standard-Google-Konto schaltet auf der Gemini CLI 1.000 OAuth-Anfragen pro Tag frei. Cursor Hobby liefert monatlich 2.000 Tab-Completions plus 50 langsame Premium-Anfragen. Wer sich bei SiliconFlow in China registriert, erhält 20 Millionen permanente Token. Stapeln Sie Cursor Pro (20 $/Monat), Claude Pro (20 $/Monat) und Copilot Pro (10 $/Monat), liegen Sie schnell bei über 600 $ pro Jahr — dieser Leitfaden zeigt, wie Sie den Großteil der täglichen Arbeit mit 0 € abdecken.
Der Artikel richtet sich an Indie-Entwickler, Studierende und Ingenieure in Regionen mit ungleichmäßigem Zugang zu US-gehosteten Diensten. Wir kartieren Free Tiers für Gemini CLI, Codex CLI, Claude Code, OpenCode, OpenClaw, GitHub Copilot und Cursor sowie regionale APIs wie SiliconFlow, Alibaba Model Studio und Zhipu GLM. Nach dem Lesen wissen Sie, welche Tools keine Kreditkarte brauchen, was vor dem Gemini-CLI-Shutdown am 18. Juni 2026 zu tun ist, wie Terminal-Agenten ohne VPN in China laufen und wie sich Free Quotas in einem Mac-basierten 7×24-Workflow strecken lassen.
01 Warum kostenloses KI-Coding schwieriger ist als die Schlagzeilen vermuten lassen
Suchergebnisse versprechen unbegrenzte Assistenten. In der Praxis scheitern nachhaltige Zero-Cost-Workflows aus Gründen, die wenig mit der Headline-Quota zu tun haben.
- Kurze Policy-Fenster: Google wird Gemini CLI für Free-, Google-AI-Pro- und Ultra-Einzelnutzer am 18. Juni 2026 einstellen. Die Migration zur Antigravity CLI ist Pflicht. Wer noch OAuth-frei auf Gemini setzt, hat weniger als zwei Wochen, um Alternativen zu proben.
- Studenten-Vorteile verschärft: Seit dem 20. April 2026 pausiert GitHub neue Anmeldungen für Copilot Student, Pro und Pro+ (Copilot Free bleibt offen). Verifizierte Studierende behalten Zugang; Neueinsteiger können sich nicht mehr auf den Student-Pro-Shortcut verlassen.
- Netzwerk-Schichten: Offizielle Pfade für Gemini CLI, Codex CLI und Claude Code setzen stabilen Zugang zu US-Endpunkten voraus. Große Quotas nützen nichts, wenn OAuth-Handshakes auf einem instabilen Hotspot scheitern.
- Token-Schwarze Löcher:
/initin Claude Code und Codex scannt das gesamte Repository auf einmal und verbrennt oft Hunderttausende Token. Viele beschuldigen das Modell, obwohl Fehlbedienung die Ursache ist. - DSGVO bei Cloud-Daten: Prompts, Repo-Pfade und Logs können personenbezogene oder vertrauliche Inhalte enthalten. Cloud-CLIs leiten Daten häufig in Drittländer weiter — vor Produktionsstart ist eine DSGVO-Risikoanalyse (Auftragsverarbeitung, Drittlandtransfer, Löschfristen) sinnvoll.
Kernaussage: Kostenloses KI-Coding heißt nicht, ein für immer kostenloses Tool zu finden — sondern ein Portfolio aus rotierenden Clients, regionalen API-Fallbacks und Nutzungsdisziplin aufzubauen und Migrationen vor Policy-Änderungen zu üben.
02 Juni-2026-Snapshot: Free-Tier-Vergleich für gängige Coding-Assistenten
Die Tabelle spiegelt öffentliche Free Tiers zum 9. Juni 2026 wider. Policies ändern sich — vor Produktions-Workflows Vendor-Seiten erneut prüfen.
| Tool / Plattform | Free Quota | Bezahltes Konto nötig | Direktzugang aus China |
|---|---|---|---|
| Gemini CLI (OAuth) | 1.000 Anfragen/Tag, 60/min | Nein | Proxy nötig |
| Gemini API (AI Studio) | Flash 1.500/Tag; Pro 100/Tag | Nein | Proxy nötig |
| Codex CLI | ChatGPT-Free-Konto (zeitlich begrenzt) | Nein | Mit regionaler API |
| OpenCode | Client kostenlos; API nach Verbrauch | Nein | Mit regionaler API |
| GitHub Copilot Free | 2.000 Completions + 50 Premium/Monat | Nein | Ja |
| Cursor Hobby | 2.000 Tab + 50 langsame Premium/Monat | Nein | Ja |
| SiliconFlow | 20 Mio. Token bei Registrierung (permanent) | Nein | Ja |
| Alibaba Model Studio | 70 Mio. Token (70+ Modelle) | Nein | Ja |
Drei Linien mit Priorität: (1) Bei stabiler internationaler Konnektivität bleibt Gemini CLI OAuth bis zum 18. Juni die großzügigste offizielle CLI. (2) Ingenieure in China sollten SiliconFlow oder Model Studio mit OpenCode oder Codex auf einem regionalen Endpunkt koppeln — Terminal-Agenten ohne VPN. (3) Cursor und Copilot Free decken IDE-Completions ab; CLI-Agenten orchestrieren mehrere Dateien — sie ergänzen sich statt sich zu ersetzen.
Für EU-Teams gilt unabhängig vom gewählten Modell: Wer Prompts und Repository-Inhalte über US-Cloud-CLIs verarbeitet, sollte vor dem Rollout prüfen, ob ein Auftragsverarbeitungsvertrag vorliegt und ob Daten in Drittländer übermittelt werden. Das betrifft insbesondere Claude Code und Codex CLI, wenn der Traffic nicht über einen regionalen OpenAI-kompatiblen Endpunkt läuft. Ein dokumentiertes Verzeichnis der verarbeiteten Datenarten erleichtert spätere Audits und reduziert Überraschungen bei stillschweigend aktivierter Telemetrie oder Cloud-Sync.
03 Gemini-CLI-Shutdown, Codex-Domestik-Konfiguration und OpenCode-Free-Modelle
Gemini CLI (nutzen vor dem 18. Juni): Installieren, Google OAuth wählen, kein API-Key und keine Kreditkarte. Mit /model Modelle wechseln und mit /stats model die Tagesnutzung prüfen. Offizielle Docs listen 60 RPM / 1.000 RPD für Einzelpersonen. OAuth-Token sind nur für persönliche Terminals; Weiterleitung über Dritt-Proxies verstößt gegen die ToS und riskiert Kontosperren.
Node.js 18+
npm install -g @google/gemini-cli
gemini
Sign in with Google wählen
/model
/stats model
Codex CLI (regionaler API-Pfad): OpenAI-Terminal-Agent; Free-ChatGPT-Konten können OAuth nutzen (aktuelle Policy auf openai.com prüfen). ~/.codex/config.toml auf SiliconFlow oder einen OpenAI-kompatiblen Endpunkt zeigen.
openai_base_url = "https://api.siliconflow.cn/v1"
model = "deepseek-ai/DeepSeek-V3"
sandbox_mode = "workspace-write"
web_search = "disabled"
export OPENAI_API_KEY="sk-xxxx" setzen, dann codex doctor ausführen.
OpenCode und OpenClaw: OpenCode unterstützt 75+ Provider; Keys über /connect binden. OpenClaw kann Gemini-CLI-OAuth wiederverwenden. Empfohlener Free-Stack: Gemini 2.5 Flash (1.500 AI-Studio-Calls/Tag), SiliconFlow DeepSeek-V3, lokales Ollama Qwen3 über Metal-Backend auf Apple Silicon.
Copilot und Cursor: Copilot Free unter GitHub Settings aktivieren. Cursor Hobby bietet 2.000 Tab-Completions monatlich; Studierende können ein Jahr Pro unter cursor.com/students beantragen.
Claude Code (optionaler regionaler Pfad): Der Terminal-Agent von Anthropic lässt sich über ANTHROPIC_BASE_URL in ~/.claude/settings.json auf einen OpenAI-kompatiblen Proxy oder einen EU-näheren Endpunkt umleiten. Die Seatbelt-Sandbox auf macOS bleibt der sicherste Pfad für Dateizugriffe — ein Grund, warum viele Teams Agenten auf Bare-Metal-Macs statt auf Linux-VPS betreiben. Lokale Modelle über Ollama mit Metal-Backend auf Apple Silicon reduzieren Cloud-Datenflüsse für Formatierungs- und Review-Tasks erheblich.
Bei Verarbeitung vertraulicher Quelltexte in der Cloud empfiehlt sich parallel ein Verzeichnis, welche CLI-Komponente welche Felder an welchen Anbieter sendet — das erleichtert die DSGVO-Dokumentation bei Audits. Lokale Inferenz über Ollama auf Bare-Metal mit Metal reduziert externe Datenflüsse, ersetzt aber keine Rechtsberatung.
Offizielle Policy-Seiten (vor Produktionsnutzung erneut öffnen):
https://github.com/google-gemini/gemini-cli/discussions/27274
https://developers.google.com/gemini-code-assist/resources/quotas
https://github.blog/changelog/2026-04-20-changes-to-github-copilot-plans-for-individuals/
04 Sechs Schritte vom Zero-Cost-Signup zum stabilen Terminal-Agenten
- Bedarf und Netzwerk inventarisieren: IDE-Completions, Terminal-Agenten und 7×24-Automation trennen. Sind US-Endpunkte unzuverlässig, regionale APIs mit OpenCode oder Codex priorisieren — Gemini OAuth nicht erzwingen.
- Regionale Free API registrieren: SiliconFlow (20 Mio. permanente Token), Alibaba Model Studio (70 Mio. Token) oder Zhipu GLM (20 Mio. permanent). 80%-Nutzungsalarm in der Konsole aktivieren.
- Terminal-Agent installieren: Internationaler Pfad:
npm i -g @google/gemini-clioder@openai/codex. Regionaler Pfad: OpenCode- oder OpenClaw-Install-Skripte. - Auth und Modelle konfigurieren: Gemini nutzt OAuth; Codex und OpenCode nutzen regionales
base_urlmit DeepSeek-V3, Qwen3.5 oder GLM-5. Claude Code akzeptiertANTHROPIC_BASE_URLin~/.claude/settings.json. - IDE-Free-Tiers schichten: Cursor Hobby und Copilot Free parallel — Completions in der IDE, Multi-File-Agenten in der CLI.
- Nutzungsdisziplin durchsetzen:
/init-Vollrepo-Scans verbieten; einfache Tasks an Flash oder Lite routen; vor dem 18. Juni einen echten Job auf Antigravity CLI oder OpenCode laufen lassen und Rollback dokumentieren.
05 Zitierbare Zahlen, Token-Sparregeln und CALMVPS-Abschluss
- Gemini CLI OAuth: Google dokumentiert 1.000 Anfragen pro Nutzer und Tag für Einzelpersonen; persönlicher OAuth-Dienst endet am 18. Juni 2026.
- GitHub Copilot Free: 2.000 Completions plus 50 Premium-Anfragen monatlich, ohne Kreditkarte. Student- und Pro-Neuanmeldungen seit 20. April 2026 pausiert.
- Cursor Hobby: 2.000 Tab-Completions und 50 langsame Premium-Anfragen pro Monat; Nutzung unter app.cursor.sh/account/usage.
- Regionale Signup-Boni: SiliconFlow 20 Mio. permanente Token; Alibaba 70 Mio. Token über 70+ Modelle; Zhipu 20 Mio. permanente Token — zusammen Monate leichter Agent-Arbeit.
- Groq Free Tier (Proxy nötig): 14.400 Anfragen pro Tag für schnelle Llama- und Mixtral-Inferenz als Ergänzung.
Token-Disziplin (Auswahl): Nie /init auf dem ganzen Repo; einzelne Dateien angeben; Flash-Lite für Entwürfe; 80%-Alarme setzen; mehrere Google-Konten für separate Gemini-API-Quotas rotieren; Formatierung an lokales Ollama via OpenCode auslagern; OpenRouter-Free-Modelle mit OpenClaw models scan prüfen. Ergänzend: Agent-Logs regelmäßig rotieren, damit keine personenbezogenen Prompt-Reste unbegrenzt auf der Festplatte liegen — ein praktischer Baustein für DSGVO-konforme Aufbewahrung in kleinen Teams ohne dediziertes Compliance-Team.
Free-Token-Workflows auf einem MacBook, das beim Zuklappen schläft, brechen OAuth-Sessions, launchd-Agenten und SSH-Tunnel. Ein Linux-VPS ohne macOS kann Claude-Code-Seatbelt-Sandboxes oder Xcode-Toolchains nicht ausführen. Laptop-Hotspot-VPN-Pfade scheitern oft beim OAuth-Refresh. Für 7×24 OpenClaw-, Codex- oder Hermes-Jobs, geteilte Bare-Metal-Umgebungen und elastische M4- oder M4-Pro-Konfigurationen pro Projekt ist CALMVPS Bare-Metal-Mac-Miete meist die bessere Produktionswahl: dediziertes Apple Silicon, Provisionierung in ca. 120 Sekunden und flexible Tages- bis Quartalsabrechnung, damit Free-API-Quotas in Inferenz fließen — nicht in Netzwerk-Jitter. Preise: Mac-mini-M4-Mietpreise, Betrieb: Hilfezentrum, Bestellung: Mac mini M4 bestellen.