INFINITIX AI-Stack · 智能語音介面層

會聽 · 會講 · 會學習的
企業 AI 基座

用一顆 NT$500 的 ESP32，
讓主管 / 業務 / 工程師用中文語音操作 GPU 叢集。

申請 30 天 Pilot 看 4 個展台情境

📍 Computex 2026 📅 6/2 – 6/5 🏢 南港 INFINITIX 攤位

▶

90 秒 demo（拍攝中）

4 個展台情境

30 秒

破冰款

路人對小智說「嗨」，小智自我介紹現在的 GPU 狀態，大螢幕同步亮起 Dashboard。

90 秒

業務款

「幫我用 2 張 H100 跑情緒分析」— 容器啟動、Telegram 通知、12 分鐘後回報結果。

60 秒

智慧學習

說「以後跑昨天那個」就能直接派工 — Hermes 自動建立 skill，越用越懂你。

30 秒

異常通報

3 號機 GPU 過熱，小智主動廣播「已自動降載，建議檢查散熱」。

技術架構

Hermes Agent (Nous Research 開源) × AI-Stack REST × LiteLLM × 小智 ESP32 — 全部地端可跑、全部模組可換。

小智 ESP32（展台 ×3）
   ↓ websocket
Hermes Gateway（FastAPI / K8s）
   ↓
Hermes Brain（model-agnostic via LiteLLM）
   ├─ HermesRouter（PII / 複雜度 / 隱私 → 路由）
   ├─ wiki_query / file / lint（LLM Wiki，取代 RAG）
   ├─ aistack_*（6 個 GPU 容器管理 tool）
   └─ skill memory（跨 session 學習）
   ↓
LiteLLM Proxy（OpenAI / Anthropic / Llama / vLLM 統一抽象）
   ↓
[GPT-4o-mini] [GPT-4o] [Claude] [Llama 3.1 70B 地端]

地端優先
含 PII 的請求自動路由到地端 Llama 70B，不出公司網路

模型平價
LiteLLM 抽象底層 — 換模型 = 改一行 config

學習迴圈
LLM Wiki 累積使用模式，Hermes 越用越懂你的工作流

跟 Run:ai / ClearML / Rafay 差在哪？

面向	ixClaw	Run:ai	ClearML	Rafay
中文語音入口	✅ 原生	❌	❌	❌
IoT 硬體（ESP32）整合	✅ NT$500	❌	❌	❌
學習迴圈（skill 自動生成）	✅	❌	⚠️ 部分	❌
地端部署	✅ Helm	✅	✅	✅
多 LLM 路由（成本優化）	✅ 內建	❌	⚠️	❌

完整比較表將在 W-2 補上。申請 Pilot 取得詳細白皮書。

申請 Pilot — 30 天免費 + 1 對 1 onboarding

展期前申請者享有優先排程；24 小時內 INFINITIX 會聯繫您。

會聽 · 會講 · 會學習的企業 AI 基座