在世界上我们只活一次，所以应该爱惜光阴。必须过真实的生活，过有价值的生活。——巴甫洛夫

Project AIRI：把“数字生命 / AI VTuber”装进你的设备里（Web / 桌面 / 移动端），还能语音聊天、打 Minecraft、玩 Factorio（基于 README + Repo Description）

仓库：https://github.com/moeru-ai/airi
文档站：https://airi.moeru.ai/docs/
在线体验：https://airi.moeru.ai

Repo description（原文）：

💖🧸 Self hosted, you-owned Grok Companion, a container of souls of waifu, cyber livings to bring them into our worlds, wishing to achieve Neuro-sama’s altitude. Capable of realtime voice chat, Minecraft, Factorio playing. Web / macOS / Windows supported.

README 的一句话定位（原文）：

Re-creating Neuro-sama, a soul container of AI waifu / virtual characters to bring them into our world.
并明确写到：
Heavily inspired by Neuro-sama

0. AIRI 到底是什么？它想实现什么样的“未来感”？

很多 AI 陪伴类产品做到最后，都会落到一个问题上：

聊天很容易（LLM 已经足够强）
但**“一起生活”很难**：语音对话、长时间陪伴、看得见的形象、游戏互动、跨设备、可扩展、还能自托管……

AIRI 在 README 里用很“中二但准确”的表达把目标说出来了：
它要做的是 cyber living being / digital companion / cyber waifu——你可以把它理解成“把虚拟角色带进现实世界的一套容器（soul container）”。

并且它不满足于“能聊”：

But, what about the abilities to play games? And see what you are coding at? Chatting while playing games, watching videos, and is capable of doing many other things.

所以 AIRI 的野心更接近一种“可行动的数字生命”：
能实时语音聊天、能在 Discord/Telegram 里出现、还能去玩 Minecraft / Factorio。

1. 它和常见 AI VTuber 项目有什么不同？README 给出的答案是：从第一天就押注 Web 技术栈

AIRI 的 README 有一段很清晰的“差异化声明”：

Unlike the other AI driven VTuber open source projects, アイリ was built with support of many Web technologies such as WebGPU, WebAudio, Web Workers, WebAssembly, WebSocket, etc. from the first day.

也就是说，它不是“Web 版只是一个 UI”，而是把 Web 作为一等公民（甚至是核心运行时之一）来设计的。

但它也提前回应了一个常见担忧：性能会不会不行？

README 的意思是：

浏览器版更多是展示“浏览器和 webview 能 push 到什么程度”
但不会完全依赖 Web：桌面版默认可以使用 NVIDIA CUDA / Apple Metal（README 里也提到 thanks to HuggingFace & beloved candle project）
取舍是：部分功能用 Web 体系做图形/布局/动画，以及 WIP 的插件系统；需要 TCP、Discord 语音、联机游戏这类“非 Web 强项”的能力，则留给桌面/扩展能力来打开

最终它得到一个很诱人的特性（README 原文强调）：

アイリ is capable of running on modern browsers and devices and even on mobile devices (already done with PWA support).

2. “当前进度”一眼看懂：Brain / Ears / Mouth / Body 的模块化人格

AIRI 的 README 用一个很形象的方式列出能力：把系统拆成四个拟人化模块。

2.1 Brain（大脑）：能玩游戏、能在社交平台聊天

Play Minecraft
Play Factorio（WIP，但有 PoC/demo，并指向 moeru-ai/airi-factorio）
Chat in Telegram
Chat in Discord
Memory（记忆）：
- 纯浏览器数据库支持：DuckDB WASM | pglite
- Memory Alaya（WIP）
纯浏览器本地（WebGPU）推理（还在计划中）

2.2 Ears（耳朵）：浏览器音频输入 + 语音识别 + 讲话检测

Audio input from browser
Audio input from Discord
Client side speech recognition
Client side talking detection

2.3 Mouth（嘴巴）：语音合成

ElevenLabs voice synthesis

2.4 Body（身体）：VRM + Live2D，带基础“生命感”动画

VRM support（可控制 VRM）
VRM 动画：auto blink / auto look at / idle eye movement
Live2D support（可控制 Live2D）
Live2D 动画：auto blink / auto look at / idle eye movement

这一段写得非常“产品化”：
它不空谈“我们要做数字生命”，而是把体验拆成你能感知的链路：能听、能说、能动、还能行动（游戏/社交）。

3. 开发与运行：三种 “Stage”，分别对应 Web / 桌面 / 移动端

AIRI 的开发指引在 README 里给得很明确，而且直接给了命令（适合你复制粘贴就跑）。

3.1 通用开发启动

README 写法：

1 2	pnpm i pnpm dev

并特别提示：

By default, pnpm dev will start the development server for the Stage Web (browser version).

也就是说，默认 pnpm dev = 先从 Web 版开始体验和开发。

3.2 Stage Web（浏览器版）

pnpm dev

并给出线上地址（README 原文）：https://airi.moeru.ai

3.3 Stage Tamagotchi（桌面版）

1	pnpm dev:tamagotchi

同时 README 提到提供了 Nix 包（Tamagotchi）：

1	nix run github:moeru-ai/airi

前提：启用 flakes（README 明确写了 “make sure to enable flakes”）。

3.4 Stage Pocket（移动端）

启动 capacitor web 版本：

1	pnpm dev:pocket

然后 README 给了一段非常“真实开发现场”的输出示例：你需要看 Network 地址里的 <ip>，再把这个 dev server URL 喂给 iOS 工程：

1	CAPACITOR_DEV_SERVER_URL=https://<your-ip-address>:5273 pnpm open:ios

还有一个“容易踩坑但写得很实用”的提示：
如果需要在 pocket 里用无线模式连接 server channel，得用 root 启 tamagotchi：

1	sudo pnpm dev:tamagotchi

然后在 tamagotchi 的 settings/system/general 里启用 secure websocket（README 原文）。

3.5 文档站开发

1	pnpm dev:docs

4. LLM Provider 支持：一口气对接很多家（README 指出由 xsai 驱动）

AIRI README 专门列了 “Support of LLM API Providers (powered by xsai)”：

其中已经支持（README 勾选）包括：

OpenRouter、vLLM、SGLang、Ollama
Google Gemini、OpenAI、Anthropic Claude
DeepSeek、Qwen、xAI、Groq、Mistral
Cloudflare Workers AI、Together.ai、Fireworks.ai、Novita、Zhipu、SiliconFlow、Stepfun、Baichuan、Minimax、Moonshot AI、ModelScope、Player2、Tencent Cloud
以及 302.AI（README 标注 sponsored）

也列出了一些 “PR welcome” 的未完成项，例如：

Azure OpenAI API
AWS Claude
Sparks、Volcano Engine 等

这份清单的意义在于：AIRI 的“角色灵魂”并不绑定某一家模型供应商，它更像一个可更换大脑的容器。

5. 一个很值得写进博客的亮点：AIRI 不只是一个仓库，它还“生出了一堆子项目”

README 有一节 “Sub-projects Born from This Project”，列了许多衍生项目。这里面有几个一看就很硬核：

unspeech：/audio/transcriptions 和 /audio/speech 的通用 endpoint proxy（README 说像 LiteLLM，但面向 ASR/TTS）
hfup：帮助部署/打包到 HuggingFace Spaces 的工具
xsai-transformers：Transformers.js provider（用于 xsAI）
tauri-plugin-mcp：与 MCP servers 交互的 Tauri 插件
AIRI Factorio / Factorio RCON API / autorio 等一整套“让 AIRI 玩 Factorio”的生态
inventory：集中式 model catalog + 默认 provider 配置的后端服务
MCP Launcher：像 Ollama 一样的 MCP builder & launcher（README 原话：just like Ollama for models）

README 还给了一个很长的 Mermaid 架构图，把 Core、UI、Stage、Server runtime、STT、Factorio/Minecraft agents、xsAI 等连接起来——如果你打算深入二次开发，这张图本身就像“地图”。

6. 可直接放进文章的“代码/命令案例”（全部来自 README）

6.1 最快跑起来（Web）

1 2	pnpm i pnpm dev

6.2 桌面版（Stage Tamagotchi）

1	pnpm dev:tamagotchi

或用 Nix（README 原文）：

1	nix run github:moeru-ai/airi

6.3 移动端（Stage Pocket + iOS）

1	pnpm dev:pocket

然后：

1	CAPACITOR_DEV_SERVER_URL=https://<your-ip-address>:5273 pnpm open:ios

如果要无线连 server channel（README 提示）：

1	sudo pnpm dev:tamagotchi

6.4 文档站

1	pnpm dev:docs

7. 写在最后：AIRI 的迷人之处，是“把 AI 陪伴从聊天框里解放出来”

很多项目把“AI 角色”做成一个 UI；而 AIRI 更像是在做一个“可运行的生命体容器”：

有耳朵（能听）
有嘴巴（能说）
有身体（可见、会动）
有大脑（能思考、能行动、能在游戏/社交平台里存在）
还能跨平台：Web / 桌面 / 移动端，并强调自托管、你拥有（you-owned）

它确实重度受 Neuro-sama 启发（README 原文也很坦诚），但它把目标落到了一个更开放的方向：
让“数字生命”不再只存在于别人的直播间，而是能被你带走、运行在你的设备里。

相关推荐

2024-07-08

ai工具箱latentbox

在每个死胡同的尽头，都有另一个维度的天空，在无路可走时迫使你腾空而起，那就是奇迹。——廖一梅 Latent Box AI、创意和艺术领域的精选合集，来自 Latent Cat。 https://github.com/latentcat/latentbox 什么是 Latent BoxLatent Box 是一个重新构想的聚合站，由 Latent Cat 组织维护。为什么要做这件事情？我们有下面几个小小的追求：通过高质量的内容抹平信息差。我们不需要另一个搜索引擎、收录大量的网站、产品，配置复杂的自动化、检索和用户系统——因为那根本没人会看。我希望当我们收录一千个站点时，其中的一百个都是用户会打开试试并记住的、真正好的东西。尽可能多元、跨界。我们认为一个好的产品、好的技术、好的团队，所涉及的学科知识、专业技能都是非常宽广的，希望这份合集能涵盖尽可能多的创意领域。因此，它适合同样热衷于突破自我的你。保持更新、社区共创。保持更新非常难，社区会是我们坚持下去的动力。所以，我们在 GitHub 开源了整个网站，并建立了 Twitter、小红书账号，和 Discord、微信群。...

2024-06-13

gradio

家庭和睦是人生最快乐的事。——歌德 Gradio 是通过友好的 Web 界面演示机器学习模型的最快方式，以便任何人都可以在任何地方使用它！ https://www.gradio.app/ https://github.com/gradio-app/gradio 比如说代码如下 1234567import gradio as grdef greet(name): return "Hello " + name + "!"demo = gr.Interface(fn=greet, inputs="text", outputs="text")demo.launch() 就能实现一个简单的类似ChatGPT一样的web界面来演示机器学习

2025-09-12

openpi

生命是一条艰险的狭谷，只有勇敢的人才能通过。——米歇潘开源物理智能体：深度解读 Physical-Intelligence/openpi 项目随着人工智能与机器人技术的飞速发展，“物理智能体”成为了学界与业界追逐的新前沿。今天要为大家介绍的是一个拥有近7000 Star、活跃度超高的开源项目 —— Physical-Intelligence/openpi。项目简介openpi 是由 Physical-Intelligence 团队推出的开源物理智能体平台，主打“物理推理+智能体架构”。项目采用 Apache-2.0 许可，主语言为 Python。它不仅拥有丰富的代码示例和高质量文档，而且活跃度极高（90+ issues、774 forks），是物理智能相关领域的佼佼者。仓库主页：https://github.com/Physical-Intelligence/openpi 为什么要关注 openpi？硬核的物理推理能力：聚焦“物理世界智能体”，可用于模拟、推理、学习、规划等多种场景。极高的开源社区活跃度：近7000 Star，持续更新，开...

2025-08-28

agent-chat-ui

忘记和不曾察觉的事，等于从未发生。――史铁生 https://github.com/langchain-ai/agent-chat-ui LangChain Agent Chat UI：让智能体对话可视化与交互一站式实现在大模型、AI 智能体爆发的时代，越来越多开发者希望将强大的 AI 代理（Agent）能力嵌入自己的产品，无论是智能问答、助理对话、业务流程自动化，还是复杂的多智能体协作场景。你是否想过，如何用最方便、最现代的方式在前端实现与 Agent 的实时交互？你是否希望拥有一个开箱即用、可自定义、支持多智能体、多轮对话的 Web UI？那么，LangChain 官方出品的 agent-chat-ui 就是你不可错过的开源宝藏！一、项目简介agent-chat-ui 是 LangChain 官方团队打造的开源 Web UI 项目，专为 Agent（智能体）对话和多智能体协作场景设计。它以极简集成、强大功能、现代体验为特色，让开发者可以一键拥有“类 ChatGPT”级别的 Agent 聊天界面，并支持可视化多智能体、工具调用、任务流追踪等高级特性。项目地址：htt...

2026-05-20

academic-research-skills

丈夫志四海，万里犹比邻。——曹植 https://github.com/Imbad0202/academic-research-skills 《Academic Research Skills》：一支会“自我约束”的学术协作队，陪你把研究从灵感一路护送到发表我第一次点开 Imbad0202/academic-research-skills 的时候，它像一位穿着白大褂、手里拿着流程夹的“学术总监”，站在门口先跟我握手，然后很认真地补了一句自我介绍： Academic Research Skills for Claude Code: research → write → review → revise → finalize (github.com) 它不是那种一上来就把整篇论文“吐”给你的神秘写作机，更像是一个有职业操守的研究搭子：把最苦最脏最容易出错的环节接过去——找文献、查证据、排版引用、检查逻辑一致性、做质量门禁——让你把精力留给真正需要大脑的部分：提出问题、选择方法、解释结果、写出“我认为”的那句话。(github.com) 你可以把它想象成：一套“会组队...

2025-09-27

HumanLayer

自尊不是轻人，自信不是自满，独立不是孤立。——徐特立 HumanLayer：AI Coding Agents 解决复杂代码难题的最优解在 AI 编码逐步普及的今天，很多开发者都遇到这样的问题：大模型/AI助手能帮你写函数、补代码，但当代码库足够复杂、系统庞大时，AI就容易“迷路”或者给出不靠谱的方案。有没有一套系统，能让 AI Coding Agents 真正高效地解决大型复杂代码库中的难题？——HumanLayer 就是为此而生的！一、项目简介项目地址：humanlayer/humanlayer 官网：https://humanlayer.dev/code 一句话描述：The best way to get AI coding agents to solve hard problems in complex codebases. 主语言：TypeScript Stars：4387+ Forks：341+ 标签：agents ai llm human-in-the-loop opencode codex claude-code 二、HumanLa...

阿超

我的名字叫阿超年龄25岁家在北京市职业是软件开发每天最晚也会在八点前回家不抽烟酒浅尝辄止晚上十二点上床保证睡足八个小时睡前写一篇博客再做二十分钟俯卧撑暖身然后再睡觉基本能熟睡到天亮像婴儿一样不留下任何疲劳和压力就这样迎来第二天的早晨健康检查结果也显示我很正常我想说明我是一个不论何时都追求内心平稳的人不拘泥于胜负不纠结于烦恼不树立使我夜不能寐的敌人这就是我在这社会的生活态度