30 秒
破冰款
路人對小智說「嗨」,小智自我介紹現在的 GPU 狀態,大螢幕同步亮起 Dashboard。
用一顆 NT$500 的 ESP32,
讓主管 / 業務 / 工程師用中文語音操作 GPU 叢集。
路人對小智說「嗨」,小智自我介紹現在的 GPU 狀態,大螢幕同步亮起 Dashboard。
「幫我用 2 張 H100 跑情緒分析」— 容器啟動、Telegram 通知、12 分鐘後回報結果。
說「以後跑昨天那個」就能直接派工 — Hermes 自動建立 skill,越用越懂你。
3 號機 GPU 過熱,小智主動廣播「已自動降載,建議檢查散熱」。
Hermes Agent (Nous Research 開源) × AI-Stack REST × LiteLLM × 小智 ESP32 — 全部地端可跑、全部模組可換。
小智 ESP32(展台 ×3)
↓ websocket
Hermes Gateway(FastAPI / K8s)
↓
Hermes Brain(model-agnostic via LiteLLM)
├─ HermesRouter(PII / 複雜度 / 隱私 → 路由)
├─ wiki_query / file / lint(LLM Wiki,取代 RAG)
├─ aistack_*(6 個 GPU 容器管理 tool)
└─ skill memory(跨 session 學習)
↓
LiteLLM Proxy(OpenAI / Anthropic / Llama / vLLM 統一抽象)
↓
[GPT-4o-mini] [GPT-4o] [Claude] [Llama 3.1 70B 地端]
| 面向 | HermesOps | Run:ai | ClearML | Rafay |
|---|---|---|---|---|
| 中文語音入口 | ✅ 原生 | ❌ | ❌ | ❌ |
| IoT 硬體(ESP32)整合 | ✅ NT$500 | ❌ | ❌ | ❌ |
| 學習迴圈(skill 自動生成) | ✅ | ❌ | ⚠️ 部分 | ❌ |
| 地端部署 | ✅ Helm | ✅ | ✅ | ✅ |
| 多 LLM 路由(成本優化) | ✅ 內建 | ❌ | ⚠️ | ❌ |
完整比較表將在 W-2 補上。申請 Pilot 取得詳細白皮書。
展期前申請者享有優先排程;24 小時內 INFINITIX 會聯繫您。