2026 年 Nous Research 開源的 Hermes Agent 在港台開發圈走紅,關鍵不在「又多一個聊天殼」,而是它把 Agent 設計成住在你機器上的長期程序:跨工作階段記憶、自動沉澱 Skill、透過 Telegram 等閘道隨時下達任務。許多人第一個問題是:筆電合蓋會不會丟記憶?樹莓派夠不夠力?VPS 行不行?
本文面向已決定私有部署 Hermes、卻在常駐硬體上猶豫的開發者與小團隊:用官方文件可核對的三層記憶架構解釋「為什麼要 7×24」,給出樹莓派 / Linux VPS / Mac Mini M4(含月租裸金屬)決策矩陣,並附六步落地清單。讀完應能判斷:重開機到底丟什麼、哪種宿主最適合讓記憶與 Skill 複利。
01 Hermes Agent 為什麼必須「一直開著」:不是迷信,是架構約束
Hermes 的定位是自改進 Agent:完成複雜任務後會把流程提煉成可複用 Skill,並在多輪對話中維護使用者畫像與專案事實。與「每次開網頁從零開始」的 Copilot 不同,它的價值隨執行時長 × 任務多樣性累積——這要求 Gateway 程序、排程任務與訊息通道在背景持續可用。
對港台團隊而言,實務痛點往往出在「以為有備份就夠」。磁碟上的 ~/.hermes/ 確實會保留,但若 Gateway 在夜間睡眠,Telegram 指令排隊、Cron 錯過觸發視窗,Skill 也無法在無人值守時持續累積。重開後檔案還在,組織體感卻像斷片一天。
- 閘道連續性:官方支援 Telegram、Discord、Slack、WhatsApp 等二十餘通道;你在手機上下指令時,Agent 應在遠端主機立即調度工具,而不是等你回家開電腦。
- 排程與無人值守:自然語言 Cron 可跑日報、備份、巡檢;主機睡眠會錯過觸發視窗,且部分沙箱工作階段無法優雅恢復。
- 記憶寫入時機:持久層在磁碟(
~/.hermes/),但目前工作階段的系統提示是 frozen snapshot;長期事實靠檔案策展與 episodic 檢索補全。程序長期在線,才能在高頻互動中持續更新 USER / MEMORY 與 Skill。 - 子 Agent 與平行:隔離子 Agent、平行終端機與 Python RPC 管道假設控制面穩定;頻繁斷電更像「拆流水線」而非「暫停一下」。
「重開會清空記憶嗎?」——磁碟上的持久記憶通常不會;真正受損的是進行中的工作階段、未落盤的中間狀態,以及 7×24 複利節奏。
架構與記憶行為以 Nous Research 官方文件為準;發版後請再次開啟下列連結核對。
02 從 Stateless 到 Persistent:三層記憶如何決定硬體門檻
社群與官方文件常把 Hermes 的記憶概括為三層;理解每一層讀什麼、寫什麼、吃多少算力,才能解釋為何「能裝得上」≠「跑得划算」。
Tier 1 是每次對話的「快取人格」;Tier 2 是團隊的程序性肌肉記憶;Tier 3 則用 SQLite 全文檢索補歷史細節。三層疊加後,換宿主機的成本不再是重裝一個二進位檔,而是遷移整個 ~/.hermes/ 生態。
| 層級 | 載體 | 作用 | 對宿主的要求 |
|---|---|---|---|
| Tier 1 高訊號狀態 | MEMORY.md、USER.md |
專案事實與使用者畫像,進入每次系統提示的策展片段 | 低 IO、穩定磁碟;字元上限由設定強制(見第 5 節) |
| Tier 2 程序性 Skill | ~/.hermes/skills/ Markdown |
把成功工作流固化為可複用「肌肉記憶」,遵循 agentskills.io 約定 | 目錄可備份、可版本管理;任務越複雜,檔案越多 |
| Tier 3 跨工作階段檢索 | SQLite + FTS5 等 | 「上週修過的 bug」類 episodic 召回,經 LLM 摘要注入目前上下文 | 磁碟空間與索引維護;長期執行資料庫體積成長 |
Tier 1 解決「每次開機立刻知道你是誰、專案約束是什麼」;Tier 2 解決「同類任務別從零推理」;Tier 3 解決「歷史細節不必全塞進有限字元的 MEMORY」。財務對照見 Hermes 專用機 24 個月 TCO 文;本篇聚焦架構 → 常駐。
模型側,Hermes 強調模型無關:可透過 Nous Portal、OpenRouter、本地 Ollama / LM Studio 等路由;在 Apple Silicon 上,統一記憶體(UMA)讓「本地小模型做路由 + 雲端大模型做推理」的混合策略更順暢——這也是許多團隊把宿主鎖定在 Mac Mini M4 而非純 ARM 單板的原因。
03 樹莓派、Linux VPS、Mac Mini M4:我試了三種宿主,差異在這
官方 README 寫明 Hermes 可跑在「$5 VPS、GPU 叢集或 Modal 等 Serverless」——但Agent 記憶複利場景下,三種常見選擇的短板不同:
- 樹莓派 4/5:適合輕量閘道或遠端感測器式任務;記憶體與 CPU 在平行工具呼叫、本地模型、瀏覽器沙箱同時開啟時易觸頂;無 macOS 官方一鍵安裝路徑,維運成本高于預期。
- 通用 Linux VPS:月費低、公網 IP 現成;劣勢是跨區域 RTT放大工具鏈延遲,磁碟 IO 與鄰居 noisy neighbor 影響 SQLite 檢索;按量計費模型在「長任務 + 多輪重試」下帳單波動大。
- 自購 Mac Mini M4:統一記憶體、macOS 原生支援、靜音低功耗,適合桌面 7×24;但要承擔 CapEx、折舊與升配換機。
- CALMVPS 裸金屬 Mac 月租:保留 M4 + macOS 優勢,OpEx 可預測、多區域節點、租期可縮短驗證週期,適合「先讓 Hermes 跑滿 30 天再看要不要買機」。
| 維度 | 樹莓派 | Linux VPS | Mac Mini M4 月租裸金屬 |
|---|---|---|---|
| 7×24 穩定性 | SD 卡與供電是隱患 | 依賴機房,共享宿主風險 | 資料中心供電 + 獨占實例 |
| macOS 官方路徑 | 否 | 否(Linux 路徑) | 是 |
| 本地模型 / UMA | 極受限 | 通常無 Apple Silicon | 16GB / 24GB 等檔位可選 |
| 遠端指揮延遲 | 區域網路尚可 | 跨境明顯 | 可選區域節點降低 RTT |
| 試錯成本 | 硬體已 sunk | 低月費但遷移麻煩 | 日/週/月租可快速退租 |
對「記憶會複利」的 Hermes 來說,最優宿主通常是:能穩定跑滿 30 天、磁碟夠裝 ~/.hermes/、且你不必操心合蓋睡眠的那一台——不一定是家裡最便宜的那台。
04 在月租裸金屬 Mac 上常駐 Hermes:六步落地清單
下列步驟假設你透過 CALMVPS 取得SSH 可達的獨占 Mac,並在該主機上執行 Gateway。命令以官方 Installation 頁目前版本為準。
- 選型下單:在 定價頁 選擇 M4 記憶體檔位(為工具呼叫、瀏覽器沙箱與可選本地模型預留餘量),並選定區域節點與租期。
- 交付驗收:記錄 SSH 指紋、macOS 版本與磁碟餘量;確認防火牆未暴露未鑑權管理連接埠。
- 安裝 Hermes:使用官方安裝腳本完成相依性與 CLI(macOS 路徑通常一條命令)。
- 執行 setup:執行
hermes setup設定模型端點、記憶與使用者畫像開關。 - 設定常駐:用 launchd 或團隊既有守護程序方案讓 Gateway 崩潰自啟;綁定訊息通道時使用最小權限 Token。
- 備份與遷移:定期打包
~/.hermes/到物件儲存;換機或退租前完整還原目錄,而非只拷貝聊天紀錄。
curl -fsSL https://hermes-agent.nousresearch.com/install.sh | bash
hermes setup
安裝入口請以官方 Installation 頁為準。
05 可引用參數、FAQ 與 CALMVPS 場景收束
- 記憶字元上限(官方預設):
memory_char_limit: 2200、user_char_limit: 1375;超出部分靠 Skill 與 session search,而非無限堆疊系統提示。 - 資料落盤:核心目錄
~/.hermes/(設定、memories、skills、episodic 資料);遷移宿主務必目錄級備份。 - 授權:Hermes Agent 為 MIT 開源;執行後端可選本地、Docker、SSH、Modal 等,但macOS + Apple Silicon 仍是低摩擦組合。
FAQ
- 重開會丟記憶嗎? 持久檔案與 SQLite 在磁碟;遺失的是工作階段內瞬時上下文與無人值守任務的連續性。
- 只用筆電可以嗎? 適合短期試用;生產環境建議專用在線 Mac,避免睡眠與系統更新切斷閘道。
- 樹莓派能跑嗎? 能跑輕量場景;複雜 Skill + 本地模型 + 瀏覽器自動化建議 M4 檔位。
把 Hermes 放在經常合蓋的筆電上,短板是 Gateway 連續性與辦公室干擾;放在廉價跨境 VPS上,短板是延遲、IO 與 macOS 路徑缺失;放在樹莓派上,短板是算力天花板與維運碎片。對需要7×24、三層記憶持續複利、快速交付且可升配的生產環境,CALMVPS 裸金屬 Mac Mini M4 月租 通常是更優解:獨占 Apple Silicon、多區域節點、租期彈性,讓你把精力放在 Agent 能力上而非硬體噪音。機型見 CALMVPS 定價頁。