INFINITIX AI-Stack · 智能語音介面層

會聽 · 會講 · 會學習的
企業 AI 基座

用一顆 NT$500 的 ESP32,
讓主管 / 業務 / 工程師用中文語音操作 GPU 叢集

📍 Computex 2026 📅 6/2 – 6/5 🏢 南港 INFINITIX 攤位
90 秒 demo(拍攝中)

4 個展台情境

30 秒

破冰款

路人對小智說「嗨」,小智自我介紹現在的 GPU 狀態,大螢幕同步亮起 Dashboard。

90 秒

業務款

「幫我用 2 張 H100 跑情緒分析」— 容器啟動、Telegram 通知、12 分鐘後回報結果。

60 秒

智慧學習

說「以後跑昨天那個」就能直接派工 — Hermes 自動建立 skill,越用越懂你。

30 秒

異常通報

3 號機 GPU 過熱,小智主動廣播「已自動降載,建議檢查散熱」。

技術架構

Hermes Agent (Nous Research 開源) × AI-Stack REST × LiteLLM × 小智 ESP32 — 全部地端可跑、全部模組可換。

小智 ESP32(展台 ×3)
   ↓ websocket
Hermes Gateway(FastAPI / K8s)
   ↓
Hermes Brain(model-agnostic via LiteLLM)
   ├─ HermesRouter(PII / 複雜度 / 隱私 → 路由)
   ├─ wiki_query / file / lint(LLM Wiki,取代 RAG)
   ├─ aistack_*(6 個 GPU 容器管理 tool)
   └─ skill memory(跨 session 學習)
   ↓
LiteLLM Proxy(OpenAI / Anthropic / Llama / vLLM 統一抽象)
   ↓
[GPT-4o-mini] [GPT-4o] [Claude] [Llama 3.1 70B 地端]
    
地端優先
含 PII 的請求自動路由到地端 Llama 70B,不出公司網路
模型平價
LiteLLM 抽象底層 — 換模型 = 改一行 config
學習迴圈
LLM Wiki 累積使用模式,Hermes 越用越懂你的工作流

跟 Run:ai / ClearML / Rafay 差在哪?

面向 HermesOps Run:ai ClearML Rafay
中文語音入口✅ 原生
IoT 硬體(ESP32)整合✅ NT$500
學習迴圈(skill 自動生成)⚠️ 部分
地端部署✅ Helm
多 LLM 路由(成本優化)✅ 內建⚠️

完整比較表將在 W-2 補上。申請 Pilot 取得詳細白皮書。

申請 Pilot — 30 天免費 + 1 對 1 onboarding

展期前申請者享有優先排程;24 小時內 INFINITIX 會聯繫您。

目前 GPU 數量 *

送出即表示您同意我們依 隱私權政策 處理留下的資料。