voicebox
学而不思则惘,思而不学则殆。——孔子 Voicebox:一个把“声音”当成作品来对待的开源合成工作室如果你把常见的 TTS 工具想象成一台“能说话的打印机”,那 Voicebox 更像一间真正的录音棚:它不急着把字念出来,它更在乎你的声音作品能不能像人一样呼吸、停顿、带情绪、能剪辑、能叠轨、能做后期、还能被你拿去做应用。 Voicebox 的自我介绍很坦荡: The open-source voice synthesis studio.Clone voices. Generate speech. Apply effects. Build voice-powered apps.All running locally on your machine. 它像一个有点骄傲的“本地派”制作人:“我可以很强,但我更想把一切都留在你自己的机器里——模型在你这,声音也在你这。” 它是谁:本地优先的声音克隆工作室(开源版 ElevenLabs 方向)在 README 里,Voicebox 把自己定义得非常明确:它是一个 local-first voice cloning studio,是一个...
nvim-treesitter
读书越多,越感到腹中空虚。——雪莱 nvim-treesitter:一位“语法工程师”的自我修养(以及它如何让 Neovim 读懂你的代码)它第一次走进 Neovim 的那天,没带花里胡哨的 UI,也没带“我能替你写代码”的野心。 它只带了三样东西,像一个极度务实、穿着工装的工程师站在门口,敲了敲桌子: 我负责安装、更新、移除 tree-sitter parsers; 我带来一整套queries,让 Neovim 内置的 tree-sitter 功能真的能在各种语言上跑起来; 我还当一块“试验田”——把一些可能会被 upstream 到 Neovim 的 treesitter 特性先放这里孵化。 它叫 nvim-treesitter。它的描述很简短,但气质很明确: Nvim Treesitter configurations and abstraction layer 它不是来抢 Neovim 风头的,它更像是 Neovim 的“语法后勤部长”,专门负责把 parser、query、特性开关这些琐碎但关键的事情,收拾得干干净净、能持续维护、能规模化扩展。 先把误会说...
Archon
欲穷千里目,更上一层楼。——王之涣 Archon:把“看心情写代码”的 AI,拎进一条确定性的流水线里我见过太多 AI 写代码的瞬间:它像个才华横溢但不太靠谱的“天才队友”——灵感来了能一口气写完一整套功能;灵感没来就跳过计划、忘了跑测试、PR 描述随缘、分支名随缘、甚至把你的模板当空气。 你让它修 bug,它可能直接动手改;你让它写功能,它可能不做设计;你让它跑测试,它可能说“应该没问题”;你让它对齐流程,它可能反问“你要什么格式”。 于是,软件开发这种“靠流程把复杂度压平”的事,在 AI 时代又变回了“靠情绪和运气”。 Archon 看到这一幕,像一个冷静的工头站出来拍了拍桌子: “别靠模型心情。把流程写出来。按流程跑。” (github.com) Archon 是谁?Archon 的一句自我介绍非常干脆: The first open-source harness builder for AI coding. Make AI coding deterministic and repeatable. (github.com) 它把自己定位成: AI coding ...
Apollo-11
生命不能从谎言之中开出灿烂的鲜花。——海涅 Apollo-11:一份会“说话”的登月代码,把 1969 年的胆量搬进你的终端里有些仓库一打开,你会觉得它在向你挥手:“来,看看我做过什么。” 而 chrislgarry/Apollo-11 一打开,你会觉得它在低声告诉你:“别吵,我正在执行登月任务。” 它的自我介绍很简洁,却字字带着重量: Original Apollo 11 Guidance Computer (AGC) source code for the command and lunar modules.原始阿波罗 11 号制导计算机(AGC)源代码,包含指令舱与登月舱两套程序。 它不是“仿真项目”,不是“致敬复刻”,更不是“灵感重写”。它就是那份曾经真的参与过把人送上月球的代码(以当年的形态留存下来),以一种很克制的方式站在 GitHub 上,让你能够直视它、翻阅它、甚至尝试把它重新装配起来。 它是谁:指令舱与登月舱的两位“老前辈”这个仓库保存的是 Apollo 11 任务中 Apollo Guidance Computer 的两套软件: Comm...
multica
有教养的头脑的第一个标志就是善于提问。——普列汉诺夫 Multica:把编码 Agent 从“工具”升级成“队友”的开源平台在很多团队里,AI coding agent 的处境都很微妙。 它很聪明,也很勤快——前提是你一直盯着它、不断把提示词塞给它、不断复制粘贴它的输出、不断问它“下一步做什么”。它像一个临时工:能干活,但不进流程;会写代码,但不在体系里;能完成任务,但不承担责任。 Multica 站出来,拍了拍你的肩膀,然后用一种近乎宣言式的口吻说: Your next 10 hires won’t be human.你的下一批“同事”,不会是人类。 它不是又一个聊天框,不是又一套 prompt 模板,而是: The open-source managed agents platform.一个开源的“托管式 agent 管理平台”。 它把 coding agents 变成真正的团队成员:你可以像分配任务给同事那样,把 issue 交给 agent——它会自己接单、自己跑起来、自己汇报阻塞、自己更新状态,并且把解决方案沉淀成可复用的 skills,越用越强,越跑越顺。 1....
ralph
血沃中原肥劲草,寒凝大地发春华——鲁迅 Ralph:一只不肯下班的自治 AI 工程师循环体——直到 PRD 全部打勾才肯停Ralph 不是一个“聊天型”工具。 Ralph 更像是你团队里那个最较真、最执拗、最愿意熬夜的工程搭子:你把 PRD 交给他,他不问“要不要我帮你想想”,他直接开跑——一轮、一轮、再一轮——直到 PRD 上每一个条目都被标记为完成。 它的自我介绍非常直接: Ralph is an autonomous AI agent loop that runs AI coding tools (Amp or Claude Code) repeatedly until all PRD items are complete.Each iteration is a fresh instance with clean context.Memory persists via git history, progress.txt, and prd.json. 一句话翻译成工程语言:Ralph = 一个 Bash 循环 + 一个会写代码的 AI 工具 + 一个严格的任...
andrej-karpathy-skills
人生是没有毕业的学校。——黎凯 andrej-karpathy-skills:给 Claude Code 一张“人类工程师脑回路”的行为契约它不吵不闹、不跑命令、不写框架,也不摆出一堆复杂配置文件。它只是安安静静地站在你的项目门口,递上一张纸,纸上写着一句非常像资深工程师会说的话: “在你开始写代码之前,先把脑子打开。别猜,别臆想,别堆料,别顺手改别人家。把成功标准说清楚,再动手。” 这就是 forrestchang/andrej-karpathy-skills:一个单文件的 CLAUDE.md,用于改善 Claude Code 的行为方式,灵感来自 Andrej Karpathy 对 LLM 编程坑的观察。 它的仓库描述讲得很干脆: A single CLAUDE.md file to improve Claude Code behavior, derived from Andrej Karpathy’s observations on LLM coding pitfalls. 它不追求花活,它追求“少犯错、少返工、少写烂代码”。它像一个把你按在工位上的 ...
qmd
光景不待人,须叟发成丝。——李白 QMD:你的本地“记忆搜索引擎”——它不问云端要答案,只在你电脑里把一切翻出来QMD 全名 Query Markup Documents。它更愿意被叫作:你设备上的搜索引擎。 它的使命很朴素,但执行得很“狠”: 把你的 Markdown 笔记、会议纪要/转录、文档、知识库统统收进来 让你用 关键词 或 自然语言就能找回“我明明写过但死活想不起来在哪”的那段内容 并且——全程本地运行:BM25、向量语义检索、LLM 重排,统统在你电脑里完成 它对自己的定位也很直白(repo description): mini cli search engine for your docs, knowledge bases, meeting notes, whatever.Tracking current sota approaches while being all local 它像一只非常克制的猎犬:不依赖外网、不把你的资料丢到云上,只在你本地的文件夹里闻味道、追踪线索,然后把结果叼回来。 QMD 的脾气:它不是“只会关键词”的老搜索,...
personaplex
科学技术是生产力,而且是第一生产力。——邓小平 PersonaPlex:让语音模型“会说话”只是起点,它还要会“扮演”、会“换嗓音”,并且能全双工实时对话PersonaPlex 有点像一位舞台总监,站在后台对着一群全双工语音模型拍手叫停: “你不要只会把字念成声音。你要有角色。你要有声音。你要在对话里能抢话、能接话、能打断、能继续,像人一样。” 它的定位写得很直白: PersonaPlex: Voice and Role Control for Full Duplex Conversational Speech Models 而 NVIDIA 给这个仓库的描述也很简洁:PersonaPlex code.干净利落,像一句“人到工位,活到嘴边”。 PersonaPlex 到底是什么:一位“实时全双工”的语音对话演员PersonaPlex 是一个 real-time、full-duplex、speech-to-speech 的对话模型。 它不满足于“听你说完再回答”的礼貌,它更像真实交流里的那种节奏:你说着它能接;你停顿它能补;你插话它能扛;你打断它能转。 更关键的是,它不仅会“...
gallery
敏而好学,不耻下问。——孔子 Google AI Edge Gallery:把大模型请进手机里,让它在离线的掌心里开口说话有些应用天生就像展馆的馆长:灯一亮,门一开,来的人不用懂太多,就能直接上手体验未来。 Google AI Edge Gallery 就是这样的存在——它站在手机端的入口处,礼貌、骄傲、又有点迫不及待地说: 来,别光听人讲生成式 AI。把它装进你的口袋里,亲手跑一遍。 它的身份很明确: 仓库描述(description):一个画廊,展示 on-device ML/GenAI 用例,让人们可以在本地尝试并使用模型。 它更愿意这样自我介绍(README 的主旨句):Explore, Experience, and Evaluate the Future of On-Device Generative AI with Google AI Edge. 它不是论文、不是 demo 视频、不是“云端调用一次就算用过”。它是一座“随身画廊”——用手机硬件把推理跑起来,把体验交到你手里。 它想带你看的第一幅主展作品:在手机上跑开源 LLMAI Edge ...
