2026 sind OpenClaw und OpenHuman die beiden prägenden Open-Source-Pfade für einen lokalen KI-Agenten unter macOS. OpenClaw automatisiert Messaging-Kanäle wie Telegram, WhatsApp und Discord im Dauerbetrieb. OpenHuman liefert einen Desktop-Assistenten mit Memory Tree und Sprachinteraktion. Beide können Inferenz über Ollama auf Apple Silicon routen, sodass Prompts den Host nicht verlassen. Die eigentliche Frage ist selten die Installation, sondern wo der macOS-Host langfristig läuft.
Dieser Guide richtet sich an Entwickler und kleine Teams, die einen privaten Assistenten ohne Hardware-Vorinvestition betreiben wollen. Sie erhalten eine OpenClaw-versus-OpenHuman-Entscheidungstabelle, eine Vier-Wege-Hosting-Matrix, einen Sechs-Schritte-Rollout mit LaunchAgent, zitierfähige Parameter und einen Kostenvergleich inklusive DSGVO-Einordnung für EU-Teams. Danach wissen Sie, welcher Agent zu Ihrem Workflow passt, welche M4-Speicherstufe Sie mieten sollten und wie der Stack einen Monat lang online bleibt, ohne Sleep oder Swap-Thrashing.
01 Lokale KI-Agenten 2026: Installation ist einfach, Verfügbarkeit nicht
OpenClaw und OpenHuman liefern Einzeiler-Installer. Die meisten Produktionsausfälle entstehen in der Host-Umgebung, nicht im Agenten-Code:
- Laptop-Sleep bricht Kontinuität: Schließt sich der MacBook-Deckel, pausieren LaunchAgent-Jobs und das OpenClaw-Gateway. Telegram-Befehle bleiben unbeantwortet, bis jemand das Gerät weckt. macOS-Updates unterbrechen lange Agenten-Tasks mitten im Lauf.
- CapEx bei gekauftem Mac mini: Ein M4 mit 16 GB Unified Memory beginnt bei rund 600 Euro vor Steuern und Versand. M4 Pro mit 64 GB liegt deutlich über 2.000 Euro. Lieferzeiten, Abschreibung und spätere RAM-Upgrades werden zu versteckten Kosten, die Miete vermeidet.
- Linux-VPS-Kompatibilitätslücken: OpenClaws LaunchAgent-Daemon-Modell und OpenHumans Tauri-v2-Desktop-GUI setzen native macOS-APIs voraus. Auf Ubuntu entfällt der GUI-Pfad oder Sie pflegen fragile Workarounds ohne Apple Neural Engine.
- Cloud-API-Kosten und Datenresidenz: Ein 24/7-Agent, der ausschließlich über Claude- oder GPT-APIs läuft, skaliert Token-Ausgaben linear mit der Aufgabenlast. Sensible Workspace-Daten verlassen Anbietergrenzen, sofern Sie keine strikte Redaktion erzwingen.
- Fehler bei Unified-Memory-Dimensionierung: M4 mit 16 GB bewältigt quantisierte 7B- bis 13B-Modelle komfortabel. Siebzig-Milliarden-Parameter-Workloads brauchen M4 Pro mit 64 GB. Unterdimensionierung führt zu OOM-Kills oder massivem Swap und zerstört die Antwortlatenz.
Für Unternehmen in der EU ist der Datenschutz-Aspekt entscheidend: Lokale Inferenz über Ollama auf einem dedizierten Mac hält personenbezogene Prompts, Konfigurationsdateien unter ~/.openclaw/ und OpenHuman-Daten auf einem kontrollierten System. Das erleichtert die DSGVO-Konformität gegenüber SaaS-Assistenten, sofern Sie Zugriffsrechte, Verschlüsselung und ein dokumentiertes Löschkonzept bei Vertragsende sicherstellen. Ein privater Laptop mit unverschlüsselten Backups in der Cloud löst andere Compliance-Fragen als ein gemieteter Bare-Metal-Mac in Hongkong oder Singapur mit vertraglich fixierter Datenlöschung.
Die pragmatische Antwort 2026 ist kein weiterer GPU-Rack-Server. Es ist ein dedizierter Cloud-Mac mini M4: echtes Apple Silicon, natives macOS, SSH-Zugang in Minuten und monatliche OpEx unter der Anzahlung für Hardwarekauf.
02 OpenClaw oder OpenHuman? So wählen Sie zwischen den beiden Open Agenten
OpenClaw (MIT-Lizenz) ist ein terminal-first autonomes Agenten-Framework. Es lauscht auf Messaging-Kanälen und führt Shell-Befehle, Skripte und CI-Trigger auf dem Host aus. OpenHuman (GPL-3.0, TinyHumans AI) ist ein Rust-plus-Tauri-v2-Desktop-Super-Assistent mit Memory Tree für langfristiges Recall, Sprachinteraktion und Google-Meet-Teilnahme. OpenClaw ist ein Remote-DevOps-Bot; OpenHuman ein persistenter persönlicher Assistent mit Oberfläche.
| Dimension | OpenClaw | OpenHuman |
|---|---|---|
| Lizenz | MIT | GPL-3.0 |
| Primäre Oberfläche | CLI plus Messaging-Gateway | Desktop-GUI (Tauri v2) |
| Lokale Inferenz | Ollama | Ollama oder LM Studio |
| Gedächtnismodell | Sitzungs- und Workspace-Config | Memory Tree über Wochen |
| Sprache und Meetings | Keine native Unterstützung | Native Sprache plus Google Meet |
| 24/7-Daemon | LaunchAgent (openclaw onboard --install-daemon) |
Hintergrunddienst plus config.toml |
| Typische Einsatzfälle | DevOps-Automation, Message-Bots, CI-Trigger | Persönlicher Assistent, Gmail, Notion, Slack |
Entscheidungsregel: Wenn Ihr Kernworkflow lautet, eine Telegram-Nachricht zu senden und ein Remote-Mac-Skript auszuführen, wählen Sie OpenClaw. Wenn der Agent Präferenzen aus vergangenen Wochen erinnern, laut sprechen und eine Desktop-UI zeigen soll, wählen Sie OpenHuman. Beide können auf derselben M4-Instanz koexistieren: OpenClaw betreibt die Gateway-Automation, OpenHuman dient als Desktop-Assistent und teilt sich ein Ollama-Backend. Budgetieren Sie Unified Memory sorgfältig bei Dual-Betrieb. Install-Einstiegspunkte folgen der jeweiligen README; nach Upstream-Releases die offiziellen Links erneut prüfen.
03 MacBook, gekaufter Mac, Linux-VPS oder Bare-Metal-Miete: Hosting-Matrix
Derselbe OpenClaw-plus-Ollama-Stack verhält sich je nach macOS-Standort unterschiedlich. Die Host-Wahl beeinflusst Tag-zwei-Zuverlässigkeit oft stärker als die Modellwahl:
| Dimension | Lokales MacBook | Gekaufter Mac mini M4 | Linux-VPS | CALMVPS Bare-Metal-Miete |
|---|---|---|---|---|
| 24/7-Verfügbarkeit | Unterbrochen durch Sleep und Deckel | Ja, braucht festen Arbeitsplatz | Ja, aber ohne macOS-GUI-Stack | Rechenzentrum-Dedicated-Instanz |
| OpenHuman-GUI | Unterstützt | Unterstützt | Tauri-macOS-Pfad nicht verfügbar | Per VNC-Remote-Desktop nutzbar |
| LaunchAgent-Daemon | Unterstützt | Unterstützt | Systemd-Neuschreibung nötig | Native Unterstützung |
| Apple-Silicon-Inferenz | Abhängig vom Laptop-Modell | Volle M4-Neural-Engine-Geschwindigkeit | Keine | Physisches M4- oder M4-Pro-Silicon |
| Anfangsinvestition | Vorhandenes Gerät | 600 bis 2.000+ Euro CapEx | Geringe Monatsgebühr | Tages-, Wochen- oder Monats-OpEx, schnelle Lieferung |
| Datenschutz und Compliance | Nur lokal, Homeoffice-Risiko | Nur lokal, eigene Verantwortung | Grenzüberschreitende Rechenzentren prüfen | Regionale Knoten HK, SG; DSGVO-Einordnung erleichtert |
Für Teams in APAC und Europa liefert ein Cloud-Mac in Hongkong oder Singapur Ollama-Inferenz mit geringerer grenzüberschreitender Latenz und klarerer Datenresidenz als ein generischer Linux-VPS in den USA. Personenbezogene Konversationen und Workspace-Kontext bleiben auf dem gemieteten Host; Auftragsverarbeitungsverträge mit US-Cloud-LLMs entfallen, solange Sie rein lokal inferieren. Diese Kombination lässt sich auf Nicht-macOS-Hosts kaum replizieren.
Wer OpenHuman per VNC bedient und OpenClaw per SSH wartet, braucht einen Host, der weder schläft noch durch Container-Eviction verschwindet. Bare-Metal-Miete ist hier kein Luxus, sondern die kleinste Einheit für produktionsreifen Agentenbetrieb.
04 Sechs Schritte: Ollama, OpenClaw und OpenHuman auf gemietetem Mac
Die Schritte setzen SSH-Zugang zu einem dedizierten Mac mini M4 von CALMVPS und Node.js 22 oder neuer voraus. Node 24 wird empfohlen. Befehle entsprechen der Upstream-Dokumentation Stand Mai 2026; vor Produktions-Cutover gegen offizielle Repositories prüfen.
- Stufe wählen und bestellen: Auf der Preisseite Speicherstufe festlegen. Sechzehn Gigabyte reichen für einen Agenten mit 7B- bis 13B-Modellen. Vierundzwanzig Gigabyte oder M4 Pro mit 64 GB tragen 70B-Modelle oder Dual-Agenten-Workloads. Region und Mietlaufzeit auswählen.
- Ollama installieren und Modelle pullen: Ollama per Homebrew oder offiziellem Installer deployen. Quantisiertes Instruct-Modell wie Qwen2.5, Llama 3 oder Gemma3 pullen.
OLLAMA_KEEP_ALIVE=-1in der LaunchAgent-Umgebung setzen, damit Modelle zwischen Agenten-Aufrufen warm bleiben. - OpenClaw installieren: Offiziellen Einzeiler ausführen, dann
openclaw onboard --install-daemonfür LaunchAgent-Registrierung und Messaging-Kanäle. Model-Provider aufhttp://127.0.0.1:11434zeigen. - OpenHuman installieren (optional): OpenHuman-Install-Skript ausführen. In
config.tomllocal_ai.runtime_enabled = trueundlocal_ai.opt_in_confirmed = truesetzen, Runtime auf Ollama oder LM Studio auf Loopback ausrichten. - Sicherheit härten:
openclaw security audit --fixausführen. Gateway an127.0.0.1binden.OPENCLAW_GATEWAY_TOKENin der LaunchAgent-plist setzen, nicht nur in der SSH-Sitzung. Ollama auf localhost belassen. - Validieren und überwachen: Testbefehl aus Telegram senden.
openclaw gateway statusprüfen und Ollama-Prozesse resident halten. Log-Rotation konfigurieren und periodische Backups von~/.openclaw/sowie OpenHuman-Config-Bäumen planen. Bei Vertragsende des gemieteten Macs alle personenbezogenen Agenten-Daten gemäß internem Löschkonzept entfernen.
Ollama
brew install ollama
ollama pull qwen2.5:7b-instruct-q4_K_M
export OLLAMA_KEEP_ALIVE=-1
OpenClaw
curl -fsSL https://openclaw.ai/install.sh | bash
openclaw onboard --install-daemon
OpenHuman (optional)
curl -fsSL https://raw.githubusercontent.com/tinyhumansai/openhuman/main/scripts/install.sh | bash
Für Gateway-Hybrid-Reload, Modellrouting-Änderungen und launchd-Triage auf einem Remote-Bare-Metal-Mac siehe unseren Begleitartikel zu OpenClaw Gateway Hybrid Reload und LaunchAgent-Härtung.
05 Referenzwerte, Kostenvergleich und FAQ
- Laufzeitvoraussetzungen: OpenClaw benötigt Node.js 22 oder neuer; Node 24 wird empfohlen. OpenHuman v0.53.22 (Release 2026-05-09) verlangt macOS 14 oder neuer, mindestens 8 GB RAM, 16 GB oder mehr für komfortablen Dual-Stack-Betrieb.
- Modell- und Speicher-Paarung: M4 mit 16 GB Unified Memory fährt quantisierte 7B- bis 13B-Modelle mit etwa 18 bis 45 Tokens pro Sekunde. M4 Pro mit 64 GB kann 70B-Klassen lokal mit rund 8 bis 12 Tokens pro Sekunde inferieren, abhängig von der Quantisierung.
- Standard-Ports: OpenClaw-Gateway lauscht standardmäßig auf
127.0.0.1:18789. Ollama bedient die API auf127.0.0.1:11434. Diese Ports tunneln oder per Reverse-Proxy absichern, nicht öffentlich exponieren. - Stromverbrauch: Mac mini M4 idle zwischen 8 und 15 Watt; 24/7-Betrieb auf gemieteter Hardware ist wirtschaftlich, weil Rechenzentrum-Strom und Netzwerk in der Monatsgebühr enthalten sind.
- DSGVO und lokale Daten: Prompts, Memory-Tree-Inhalte und Messaging-Token bleiben auf dem dedizierten Mac. Dokumentieren Sie Verarbeitungszwecke, Zugriffsprotokolle und Löschfristen. Hybrid-Routing zu US-Cloud-Modellen erfordert gesonderte Rechtsprüfung; reine Loopback-Inferenz minimiert Drittlandtransfer.
| Ansatz | Anfangsausgaben | Monatliche Betriebskosten | Natives macOS |
|---|---|---|---|
| Kauf M4 16 GB | Etwa 600+ Euro | Strom, Abschreibung, Arbeitsplatz | Ja |
| CALMVPS Monatsmiete M4 | 0 Euro Hardware-CapEx | Tages-, Wochen- oder Monatsabrechnung; jederzeit kündbar | Ja (physische Maschine) |
| AWS-GPU-Instanz | 0 Euro Hardware-CapEx | Typisch 500+ Euro pro Monat für vergleichbaren Durchsatz | Nein (nur Linux) |
FAQ
- Reicht nur Ollama ohne Agenten-Schicht? Ja, aber das Agenten-Framework übernimmt Tool-Calls, Kanal-Integrationen und Task-Orchestrierung. Genau das trennt einen Chat-Endpunkt von einem autonomen Assistenten.
- Können OpenClaw und OpenHuman parallel laufen? Ja, mit einer Ollama-Instanz. Planen Sie M4 mit 24 GB oder mehr und unterschiedliche Modellgrößen pro Agent oder gestaffelte Peak-Nutzung, um Speicherkonflikte zu vermeiden.
- Reicht ein lokales 8B-Modell für Produktion? Für enge Aufgaben wie Skript-Trigger, Log-Parsing und Formatkonvertierung oft ja. Mehrstufiges Reasoning profitiert von Hybrid-Routing: kleines lokales Modell für Routine, Cloud-Modell on demand für komplexe Ketten.
- Wie passt das zur DSGVO? Lokale Verarbeitung auf gemietetem Bare-Metal-Mac reduziert Auftragsverarbeitung bei US-SaaS. Sie bleiben Verantwortlicher und müssen TOMs, Backup-Ort und Löschung bei Mietende nachweisen können. CALMVPS liefert dedizierte Instanzen ohne Multi-Tenant-Nachbarschaft auf derselben macOS-Sitzung.
Agenten auf einem täglich schlafenden Laptop opfern 24/7-Kontinuität. Auf einem Linux-VPS entfallen macOS-native LaunchAgent-Semantik und die OpenHuman-GUI. Auf gekaufter Hardware tauschen Sie Flexibilität gegen CapEx und Upgrade-Reibung. Für Teams, die lokale Inferenz, Datenhoheit, schnelle Lieferung und elastische Verlängerung brauchen, ist CALMVPS Bare-Metal Mac-mini-M4-Miete meist der bessere Produktions-Fit: dediziertes Apple Silicon, Multi-Region-Knoten und Lieferung in etwa zwei Minuten, damit Sie Zeit in Agenten-Fähigkeiten statt Hardware-Ops investieren. Aktuelle M4-Stufen auf der CALMVPS-Preisseite; Bestellung über Mac mini M4 bestellen.