黄金时代在我们面前而不在我们背后。——美国作家马克·吐温
Moltbot:把你的个人 AI 助手安在“你自己”的设备上
有了 Moltbot,你不必再在各种 App 之间切换,也无需把隐私交给谁。它是一个“你自己运行、你自己掌控”的个人 AI 助手平台:在你已经使用的消息渠道里对你回复,在你自己的机器上长期驻留,连接本地工具、浏览器、语音唤醒、可视化画布,甚至还能远程安全访问。它的目标很明确:Any OS,Any Platform,The lobster way.
- 仓库与主页
- 简述
- Your own personal AI assistant. Any OS. Any Platform. The lobster way.
- TypeScript 主仓,MIT 许可
- Node 22+ 运行时,跨 macOS、Linux、Windows
它是什么:一个“本地优先”的网关与多通道助手
Moltbot 的核心是一套 Gateway 控制平面,所有会话、渠道、工具、事件都通过它统一编排。它连接你的 WhatsApp、Telegram、Slack、Discord、Google Chat、Signal、iMessage、Microsoft Teams、Matrix、Zalo、WebChat 等会话面,把 AI 助手“嵌”进你的日常工作流;再通过多代理路由、技能系统、浏览器控制、语音唤醒、可视化画布等能力,让“对话”成为操控你数字世界的统一界面。
一些关键词:
- Local-first Gateway(本地优先网关)
- Multi-channel inbox(多渠道收件箱)
- Multi-agent routing(多代理路由)
- Voice Wake 与 Talk Mode(常开语音与对话)
- Live Canvas 与 A2UI(代理驱动的可视化工作面)
- Browser control(受控的 Chrome/Chromium)
- Skills(技能安装与管理)
- Tailscale Serve/Funnel 与 SSH Tunnels(安全远程访问)
- DM pairing 与分组策略(默认安全模型)
- Sandbox 与权限隔离(非主会话可 Docker 沙箱)
快速上手:一条命令走完向导
推荐通过 CLI 向导 onboarding,它会一步步帮你配置网关、工作区、渠道与技能,macOS、Linux、Windows 都可用。
1 | |
简洁的 TL;DR 也很友好:
1 | |
运行环境:Node ≥22。升级请看 Updating 指南,并可用 moltbot doctor 排查常见问题。
支持的模型与订阅
- 支持任何供应商的模型,原生支持 Anthropic 与 OpenAI 订阅(OAuth)
- 推荐组合:Anthropic Pro/Max (100/200) + Opus 4.5,用于长上下文和抗 prompt 注入
- 模型配置与鉴权切换、自动回退都有现成方案
- Models: https://docs.molt.bot/concepts/models
- Model failover: https://docs.molt.bot/concepts/model-failover
你已经在用��渠道,直接接入
官方提供了详尽的渠道接入指南。比如:
- Telegram 配置示例
1 | |
- Discord 配置示例
1 | |
- WebChat 与 Control UI 都通过 Gateway 提供,无需单独端口
- WhatsApp、Signal、iMessage、Microsoft Teams 等均有独立文档与配额策略
默认安全模型非常务实:跨渠道 DM 默认使用配对模式,陌生来信需要配对码核验后才会进入助手处理,防止被动受控。所有策略可按需放开或加严。
架构大图:Gateway 是控制平面
1 | |
所有客户端与工具都通过 Gateway 的 WebSocket 协议汇聚到统一的事件流与工具流,天然适合做统一权限、统一日志、统一安全与统一运维。
常用配置与命令:从简单到深入
- 最小配置,只指定模型:
1 | |
- 开启浏览器控制(Chrome/Chromium,CDP 控制),颜色只是 UI 主题点缀:
1 | |
- 会话内指令(在各渠道直接发送)
- /status 查看会话模型与用量
- /new 或 /reset 重置上下文
- /compact 压缩上下文
- /think
调整思考预算 - /verbose on|off 切换详尽日志
- /usage off|tokens|full 控制回复用量尾注
- /restart 重启 gateway(群组仅所有者可用)
- /activation mention|always 控制群组激活策略
Gateway 强项:语音、画布、工具、自动化
- Voice Wake + Talk Mode:随时语音唤醒,持续对话
- Live Canvas + A2UI:代理驱动的可视化工作台,支持推送与重置、渲染与评估
- Browser Control:专属浏览器进程与快照,受控上传与持久化配置
- Nodes:跨设备摄像头抓拍、剪辑、屏幕录制、定位、系统通知
- Cron、Webhooks、Gmail Pub/Sub:把助手变成“会自己记事与执行”的自动化中心
- Skills:集中安装、管理与工作区隔离,支持 ClawdHub 检索并按需拉取
安全模型:默认安全,按需放开
- 个人主会话默认直连本机工具,体验最佳
- 非主会话(群组、公共渠道)可配置 Docker 沙箱,最小权限执行
- 默认工具 allowlist 与 denylist 清晰,避免浏览器、节点、定时器等高风险能力误暴露
- DM pairing 与 allowlist 能有效阻断陌生人注入
- Web 暴露建议配合 Tailscale Serve/Funnel 或 SSH Tunnels,确保远端访问在安全隧道内
Tailscale 指南与 Remote Gateway 指南都在文档里,开箱即用的远程模式能让你把 Gateway 放在随开随用的小 Linux 实例上,移动端或桌面端只作为“节点”执行本地动作。
开发者体验:多渠道发布、开箱即用的 Dev 循环
- 发布通道:stable、beta、dev 三轨
- 从源码构建推荐 pnpm,TypeScript 直接运行、自动重载
- UI 构建与打包步骤一条龙,兼顾开发与生产
1 | |
可选伴侣应用:把“常开体验”做到极致
- macOS:菜单栏控制、Voice Wake、PTT 覆盖层、WebChat、远程网关控制
- iOS/Android:作为节点加入,暴露 Canvas、相机、屏幕录制,配合 Gateway 做跨设备动作
- Android 示例工程提供 Compose 现代实现与前台服务保活
适合谁用
- 把多个 IM 工作流聚合到一处的个人或团队
- 追求本地优先、安全可控、长期在线的 AI 助手体验
- 需要浏览器自动化、可视化画布、跨端语音与摄像头配合的用户
- 想用 Cron/Webhooks/邮件触发把助手“自动化”的“懒人”
- 在远程设备上跑 Gateway,在本机或手机上跑“节点”的分布式玩家
小结
Moltbot 的设计哲学很朴素:把一个“好用、可信、可扩展”的个人 AI 助手安在你的设备上,统一你的对话入口,集中你的工具与事件流,配好安全策略、远程访问与自动化,让它“真的”成为你的日常伙伴。
从 moltbot onboard 开始,一步步把渠道、模型、工具与自动化串起来,等你下次需要“发条消息、拉张图、开个网页、做份总结、定个提醒”的时候,你会发现它已经在你身边等着你开口了。