Pourquoi Hermes Agent exige une machine toujours en ligne :
mémoire à trois couches et Mac mini M4

En 2026, Nous Research a publié en open source Hermes Agent — non comme un nouvel onglet de chat, mais comme un processus de longue durée sur votre matériel : mémoire persistante entre sessions, Skills qui s’accumulent, tâches reçues via Telegram et autres passerelles. La première question revient sans cesse : fermer le portable efface-t-il la mémoire ? Un Raspberry Pi suffit-il ? Un VPS bon marché tient-il la route ?

Cet article s’adresse aux développeurs et petites équipes qui veulent un déploiement privé de Hermes mais hésitent sur le matériel toujours actif. Nous détaillons le modèle officiel à trois couches, expliquons pourquoi la disponibilité est une contrainte d’architecture, comparons Raspberry Pi, VPS Linux et location bare metal Mac mini M4, et clôturons par une checklist en six étapes. À la fin, vous saurez ce qu’un redémarrage coûte réellement et quel hôte porte le mieux l’intérêt composé de la mémoire.

01 Pourquoi Hermes Agent doit tourner en continu : l’architecture, pas une superstition

Hermes est conçu comme un agent auto-améliorant. Il mène des tâches multi-étapes, transforme les workflows réussis en Skills réutilisables et maintient le contexte utilisateur d’une session à l’autre. Contrairement à un copilote sans état qui repart de zéro à la fermeture du navigateur, sa valeur croît avec le temps d’exécution multiplié par la diversité des tâches. Cela exige que le processus Gateway, les jobs planifiés et les canaux de messagerie restent joignables en arrière-plan.

Beaucoup d’équipes traitent la disponibilité comme une préférence ops. Pour Hermes, c’est une contrainte produit. L’agent suppose un plan de contrôle qui survit à la nuit, accepte les messages mobiles et continue d’écrire sur disque dans ~/.hermes/ pendant que personne n’est au clavier. Veille, suspension et reboots ad hoc n’effacent pas tout, mais ils coupent la boucle de capitalisation qui justifie un hôte dédié.

Imaginez une triage d’incidents via Telegram. Si le Gateway dort, la file stagne, les fenêtres Cron ratent leurs déclencheurs, et USER.md n’est mis à jour que lorsque quelqu’un réveille la machine. Les fichiers semblent intacts après reboot, pourtant l’organisation vit une journée d’amnésie pratique : aucun Skill neuf, aucune entrée d’index épisodique pendant la coupure.

Cette coupure explique pourquoi l’hébergement always-on apparaît d’abord dans les discussions d’architecture, avant les tableurs financiers. Vous ne payez pas seulement des watts : vous payez un accès continu en écriture à une pile mémoire qui ne prend de la valeur que si le processus continue de rencontrer le monde réel.

  • Continuité du Gateway : la documentation officielle couvre plus de vingt canaux dont Telegram, Discord, Slack et WhatsApp. Une commande envoyée depuis le téléphone doit lancer les outils sur l’hôte distant immédiatement — pas après avoir ouvert un portable le soir.
  • Planifications et travail non supervisé : Cron en langage naturel pour rapports, sauvegardes et contrôles de santé. Un hôte endormi manque les fenêtres ; certaines sessions sandbox ne reprennent pas proprement après veille.
  • Cadence d’écriture mémoire : l’état durable vit sous ~/.hermes/, mais le prompt système actif est un snapshot figé. Les faits long terme sont curatés dans des fichiers ; la recherche épisodique comble les trous. Un processus toujours en ligne met à jour USER, MEMORY et Skills lors d’interactions fréquentes au lieu de tout batcher dans de rares sessions manuelles.
  • Sous-agents et parallélisme : sous-agents isolés, terminaux parallèles et pipelines RPC Python supposent un plan de contrôle stable. Des cycles d’alimentation répétés ressemblent à l’arrêt d’une chaîne de production en plein run.

Un redémarrage efface-t-il la mémoire ? Les fichiers persistants sur disque survivent en général. Ce que vous perdez, ce sont l’état de session en cours, le travail intermédiaire non flushé et le rythme du capitalisation 24/7.

Sémantique mémoire et comportement : documentation officielle Nous Research ; revérifier les liens après chaque release.

Hermes Agent Documentation

Persistent Memory | Hermes Agent

02 Du chat sans état à l’agent persistant : trois niveaux fixent la barre matérielle

La communauté et la doc décrivent la mémoire Hermes en trois niveaux. Chacun corrige un échec différent : oublier qui vous êtes, re-raisonner des workflows déjà résolus, perdre le détail historique. Comprendre ce que chaque niveau lit, écrit et consomme en CPU, RAM et disque montre pourquoi « l’installateur tient » ≠ « l’agent est rentable sur des mois ».

Le niveau 1 est la voie rapide à chaque tour. Le niveau 2 est la mémoire musculaire organisationnelle. Le niveau 3 est le rappel assisté par recherche quand l’historique verbatim dépasserait les limites de contexte. Empilés, changer d’hôte signifie migrer tout l’écosystème ~/.hermes/, pas échanger un binaire. Les arbitrages financiers sont dans notre article TCO 24 mois ; ici le focus est architecture → hébergement always-on.

Les fichiers niveau 1 sont petits mais fortement curatés. Des plafonds de caractères gardent le prompt système net ; le détail durable migre vers Skills et SQLite plutôt qu’un markdown gonflé. Le niveau 2 grossit avec les workflows complexes répétés — Skill de déploiement, onboarding fournisseur, triage de logs — chacun représente des heures de raisonnement à ne pas payer deux fois.

Le niveau 3 rend la santé disque et index visible sur des trimestres. FTS5 sur l’historique de session extrait les épisodes pertinents sans transcrire tout dans le contexte. Sur un hôte à IO lent ou avec éviction agressive de conteneurs, la maintenance d’index devient une latence perceptible. Les Mac Apple Silicon avec SSD rapides et consommation idle prévisible conviennent à ce travail de fond.

Hermes Agent : trois couches mémoire et exigences hôte
Couche Stockage Rôle Impact hôte
Couche 1 état à signal fort MEMORY.md, USER.md Faits projet et profil utilisateur injectés à chaque prompt système IO faible, disque stable ; plafonds de caractères (section 5)
Couche 2 Skills procéduraux ~/.hermes/skills/ Markdown Workflows réussis figés en mémoire musculaire selon agentskills.io Répertoire sauvegardable et versionnable ; nombreux fichiers pour équipes complexes
Couche 3 recherche inter-sessions SQLite avec FTS5 Rappel épisodique (« bug corrigé la semaine dernière »), résumé par le LLM Base qui grossit et maintenance d’index sur des mois de service continu

Couche 1 répond à qui vous êtes et quelles contraintes s’appliquent au démarrage. Couche 2 évite de repartir de zéro sur les tâches répétées. Couche 3 garde le détail hors du petit fichier MEMORY. Côté modèle, Hermes reste agnostique — Nous Portal, OpenRouter, Ollama local. Sur Apple Silicon, la mémoire unifiée facilite l’hybride : petit modèle local pour router les outils, modèle cloud pour le raisonnement lourd. D’où l’ancrage fréquent sur Mac mini M4 plutôt qu’une carte ARM générique sans chemin macOS.

03 Raspberry Pi, VPS Linux, Mac mini M4 : trois hôtes, trois goulots

Le README indique VPS, cluster GPU ou Modal — vrai pour l’installation, pas équivalent pour une capitalisation mémoire sur des semaines sans interruption. Pi, VPS et Mac de bureau échouent à des endroits différents : compute, friction macOS, latence réseau.

Un Pi dans le placard semble vertueux jusqu’à ce que l’automation navigateur, les appels d’outils parallèles et l’inférence locale se disputent quelques gigaoctets de RAM. Un VPS outre-mer semble bon marché jusqu’à ce que chaque commande shell paie le RTT et que des voisins bruyants ralentissent SQLite. Un Mac mini acheté semble idéal jusqu’à ce que CapEx et cycles d’upgrade arrivent au bilan. La location bare metal se situe entre les deux : Apple Silicon et macOS sans engagement d’achat le jour J.

Le choix de région compte autant que le choix de puce. Hermes enchaîne de nombreux petits appels d’outils par requête utilisateur. Un RTT tolérable dans un navigateur peut empiler des runs agent de plusieurs minutes. Les nœuds bare metal CALMVPS visent une latence Gateway alignée sur l’endroit où l’équipe travaille — pas où le VPS le moins cher était disponible.

La politique de veille est un facteur subtil. macOS sur machine personnelle combat la fermeture du capot, les mises à jour automatiques et l’économie d’énergie liée à l’écran. Un Mac loué en datacenter se comporte comme de l’infrastructure : personne ne referme le capot ; vous planifiez les fenêtres de maintenance au lieu de les découvrir à 2 h du matin quand un Skill déclenché par cron avait besoin du Gateway.

  • Raspberry Pi 4/5 : adapté aux expériences Gateway légères ; pics RAM/CPU avec outils parallèles, modèles locaux et sandbox navigateur ; pas de one-liner macOS officiel, ops qui monte vite.
  • VPS Linux générique : loyer mensuel bas, IP publique immédiate ; faiblesses : RTT transfrontalier, IO disque partagé pour FTS5, surprises de facturation à l’usage sur longues retries.
  • Mac mini M4 acheté : mémoire unifiée, macOS natif, fonctionnement 24/7 silencieux ; vous portez achat, amortissement et upgrades RAM/stockage.
  • Location mensuelle Mac bare metal CALMVPS : avantages M4 et macOS, OpEx prévisible, multi-régions, baux courts pour une preuve de 30 jours avant achat.
Matrice hôte Hermes Agent (niveau scénario)
Dimension Raspberry Pi VPS Linux Location bare metal Mac mini M4
Stabilité 24/7 Carte SD et alimentation à risque Dépend du datacenter, risque hôte partagé Alimentation datacenter plus instance dédiée
Chemin macOS officiel Non Non (Linux seulement) Oui
Modèles locaux / UMA Très limité Souvent pas d’Apple Silicon Paliers 16 Go / 24 Go disponibles
Latence commande distante Correct en LAN Souvent élevée cross-border Nœuds régionaux pour réduire RTT
Coût d’expérimentation Matériel déjà sunk Loyer bas, migration douloureuse Sortie journalière / hebdo / mensuelle

Pour une mémoire qui capitalise, le meilleur hôte est souvent celui qui tient trente jours d’affilée, héberge un arbre ~/.hermes/ en croissance et ne s’endort jamais parce qu’on a refermé un capot — pas forcément l’appareil le moins cher de la maison.

04 Faire tourner Hermes sur un Mac bare metal loué : checklist en six étapes

Les étapes supposent un Mac dédié joignable en SSH via CALMVPS et l’exécution du Gateway sur cet hôte. Vérifier les commandes sur la page Installation actuelle avant la production.

Traitez la première semaine comme de l’observabilité : croissance disque sous ~/.hermes/, pics RAM avec outils navigateur et shell, latence de la passerelle dans votre région. Des baux courts existent pour valider la capitalisation mémoire avant dépense CapEx.

Après setup, faites un exercice mémoire délibéré : tâche multi-étapes, laissez Hermes écrire un Skill, redémarrez le Gateway, répétez une tâche similaire. Vous devez voir la réutilisation couche 2 et la retrieval couche 3 sans re-expliquer les bases projet. C’est le payoff produit ; l’hébergement garde la boucle en rotation.

Documentez la cadence de backup le jour de la config launchd. Des snapshots de ~/.hermes/ vers object storage coûtent peu face à la reconstruction de Skills depuis des logs de chat. La location facilite la rotation : second Mac, restore du répertoire, bascule webhooks Telegram, retrait de l’ancienne instance.

  1. Choisir et commander : sur la page tarifs, palier RAM M4 avec marge pour appels d’outils, sandbox navigateur et modèles locaux optionnels ; région et durée de bail.
  2. Accepter la livraison : noter clés SSH hôte, version macOS et espace disque libre ; aucun port admin non authentifié exposé.
  3. Installer Hermes : exécuter l’installateur officiel pour dépendances et CLI sous macOS.
  4. Lancer setup : hermes setup pour endpoints modèle, bascules mémoire et profil utilisateur.
  5. Maintenir le Gateway actif : launchd ou superviseur d’équipe pour redémarrage auto ; tokens messagerie au moindre privilège.
  6. Sauvegarder et migrer : archiver tout ~/.hermes/ vers object storage ; avant échange ou retour, restaurer le répertoire complet, pas seulement des exports de chat.
install-hermes.sh
curl -fsSL https://hermes-agent.nousresearch.com/install.sh | bash
hermes setup

Confirmer le point d’entrée install sur la page Installation officielle après chaque release.

Installation | Hermes Agent

05 Paramètres citables, FAQ et adéquation CALMVPS

  • Plafonds caractères mémoire (défauts officiels) : memory_char_limit: 2200 et user_char_limit: 1375 ; débordement via Skills et session search, pas prompts système illimités.
  • Disposition sur disque : état central sous ~/.hermes/ incl. config, memories, skills, données épisodiques ; migration hôte = backup au niveau répertoire.
  • Licence et backends : Hermes Agent est open source MIT ; backends local, Docker, SSH, Modal — macOS sur Apple Silicon reste la combinaison la moins frictionnelle pour beaucoup d’équipes.

FAQ

  • Le reboot efface-t-il la mémoire ? Fichiers persistants et SQLite restent ; vous perdez le contexte de session et la continuité des jobs non supervisés.
  • Portable seul ? Correct pour essais courts ; la production gagne avec un Mac en ligne dédié sans veille ni interruptions de mise à jour.
  • Raspberry Pi ? Oui pour gateways légers ; Skills complexes plus modèles locaux plus automation navigateur méritent un palier M4.

Hermes sur un portable refermé chaque jour casse la continuité Gateway. Sur un VPS overseas bon marché, vous échangez loyer bas contre latence, variance IO et absence de chemin macOS natif. Sur un Raspberry Pi, vous touchez le plafond compute et une ops fragmentée.

Pour une production exigeant disponibilité 24/7, capitalisation à trois couches, livraison rapide et marge pour monter la RAM, la location bare metal Mac mini M4 CALMVPS est souvent le meilleur défaut : Apple Silicon dédié, multi-régions, baux en jours ou mois plutôt qu’amortissements. Tarifs sur la page tarifs CALMVPS ; commande via commander Mac mini M4.