Handy
行动不一定带来快乐,但无行动则决无快乐。——本杰明·富兰克林 Handy:离线、自由、可扩展的语音转写应用,让你的电脑“更懂你”在语音交互逐步成为主流的今天,很多人却因为隐私、网络不稳定或商业限制无法安心使用语音转写。Handy 选择了一条简单直接又极具意义的路线:完全离线的开源语音转写应用。它不仅免费、开源,还强调可扩展与跨平台体验,是个人创作者、隐私敏感场景以及办公环境的一剂良方。 项目地址:cjpais/Handy 官网主页:https://handy.computer 项目描述:A free, open source, and extensible speech-to-text application that works completely offline. 主语言:TypeScript License:MIT Stars:8,299+ Forks:555+ 关键词:speech-to-text accessibility cross-platform tauri-v2 为什么是 Handy? 完全离线:隐私不外流,内网/弱网环境也能稳定...
PaddleOCR
别人能做到的,我也能做到;别人不能做到的,我更要做到。——韩愈 PaddleOCR:把 PDF/图片“变成结构化数据”的超级通道,助力 AI 更好理解世界在构建 AI 应用时,一个常被忽视但至关重要的环节是“数据入口”:大量信息仍保存在图像、扫描件或 PDF 文档中。如何把这些非结构化内容转化为模型可用的结构化数据?PaddleOCR 给出高效而优雅的答案。 项目地址:PaddlePaddle/PaddleOCR 官网主页:https://www.paddleocr.ai 项目描述:Turn any PDF or image document into structured data for your AI. A powerful, lightweight OCR toolkit that bridges the gap between images/PDFs and LLMs. Supports 100+ languages. 核心语言:Python License:Apache 2.0 Stars:66,119+ Tags:ocr pp-o...
Open-AutoGLM
如果你想要改变世界,先改变你自己。——圣雄甘地 Open-AutoGLM 与 Phone Agent:把“会用手机”的 AI 真正带到你的桌面在移动端的真实世界里,很多任务都需要“看懂屏幕 + 点按滑动 + 输入搜索 + 等待跳转”。Open-AutoGLM 的 Phone Agent 正是为此而生:它基于多模态视觉语言模型(VLM)理解手机屏幕内容,通过 ADB 远程操控设备,自动完成从意图解析到动作执行的完整流程。你只需用自然语言提出需求,例如“打开美团搜索附近的火锅店”,Agent 即会理解当前界面、规划步骤、执行操作、并在敏感场景请求确认或人工接管,保障安全与可控。 仓库地址:zai-org/Open-AutoGLM README(本文内容基于此):README.md 模型下载: AutoGLM-Phone-9B(中文应用优化): Hugging Face ModelScope AutoGLM-Phone-9B-Multilingual(支持英文场景): Hugging Face ModelScope 相关部署参考:与 GLM-4.1V-9B-...
nanoGPT
坚持就是胜利。——游吉祥 nanoGPT:用最简单最快的方式训练/微调中等规模 GPT在大模型成为开发“标配”的今天,很多人都希望能亲手训练或微调一个可用的 GPT。但现实往往是:工程复杂、脚本繁多、动辄几十个开关,令人望而却步。Andrej Karpathy 的开源项目——nanoGPT,则用一句话击中痛点:The simplest, fastest repository for training/finetuning medium-sized GPTs. 项目地址:karpathy/nanoGPT 项目描述:The simplest, fastest repository for training/finetuning medium-sized GPTs. 语言:Python 许可证:MIT Stars:50,711+ Forks:8,492+ 它的目标不是“最全功能”,而是“最小可用且高效”——把训练中等规模 GPT 的路径压缩到极简,既能上手学习,也能作为小团队/个人项目的工程基座。 为什么选择 nanoGPT?...
minimind
生活就像一本书,不曾旅行的人只读到了其中的一页。——圣奥古斯丁 Open Notebook:更自由、更强大的“学习型笔记”开源实现想把读论文、看书、做研究的过程彻底“智能化”?把你的资料收集、摘要整理、跨文档检索、问题答复、思维导图和项目推进,统统接入一个“懂你”的学习型笔记系统?Open Notebook,就是这样一款面向个人与团队的开源项目:更自由、更可扩展的 Notebook LM 开源实现。 项目地址:lfnovo/open-notebook 官网主页:https://www.open-notebook.ai 项目描述:An Open Source implementation of Notebook LM with more flexibility and features 主语言:TypeScript License:MIT Stars:12,366+ Forks:1,261+ 主题标签:assistant learning note-taking notebook notes-app self-learning Open Notebook 的愿景,...
open-notebook
希望是生命的源泉。——亚里士多德 Open Notebook:更自由、更强大的“学习型笔记”开源实现想把读论文、看书、做研究的过程彻底“智能化”?把你的资料收集、摘要整理、跨文档检索、问题答复、思维导图和项目推进,统统接入一个“懂你”的学习型笔记系统?Open Notebook,就是这样一款面向个人与团队的开源项目:更自由、更可扩展的 Notebook LM 开源实现。 项目地址:lfnovo/open-notebook 官网主页:https://www.open-notebook.ai 项目描述:An Open Source implementation of Notebook LM with more flexibility and features 主语言:TypeScript License:MIT Stars:12,366+ Forks:1,261+ 主题标签:assistant learning note-taking notebook notes-app self-learning Open Notebook 的愿景,是把“学习”变成一个高效、可协...
claude-cookbooks
心灵的宁静是最高的智慧。——拿破仑·希尔 Claude Cookbooks:把“用好 Claude”这件事,变成可以复刻的配方在日常工作中,我们常把大模型当作“万能问答器”。但真正把模型融入业务与产品,需要的是“可落地的方法论与配方”。Anthropic 的开源项目——Claude Cookbooks,正是为此而来:一套“可执行、可迭代”的示例笔记和配方(notebooks/recipes),展示了如何以有趣且高效的方式使用 Claude。 项目地址:anthropics/claude-cookbooks 项目描述:A collection of notebooks/recipes showcasing some fun and effective ways of using Claude. 主语言:Jupyter Notebook 协议:MIT Stars:29,128+ Forks:2,937+ 这不只是“零散的示例代码”,更像是一套“手把手的菜谱”——从模型调用、提示工程到工作流设计,帮助你把抽象的想法转化成具体的、可运行的项目原型。 ...
gpui-component
创造机会的人是勇者,等待机会的人是愚者。——罗马尼亚谚语 gpui-component:用 Rust 打造跨平台桌面应用的优雅 UI 组件库Rust 在系统编程和高性能场景广为人知,但当它走进桌面应用开发,依旧能以安全与性能优势重新定义“体验”。今天来聊一套很有潜力的开源 UI 组件库——gpui-component,它旨在用 Rust 和 GPUI 构建“令人惊艳的跨平台桌面应用”。 项目地址:longbridge/gpui-component 官网文档:https://longbridge.github.io/gpui-component/ 项目描述:Rust GUI components for building fantastic cross-platform desktop application by using GPUI. 技术标签:rust gpui uikit desktop-application License:Other Stars:8,997+ 为什么选择 gpui-component? 面向跨平台桌面:结合 GPUI(图形 UI 框...
strix
最困难的时候,也许正是你最接近成功的时刻。——查尔斯·德·高尔 Strix:AI赋能渗透测试,智能安全攻防的开源新纪元在网络安全风暴的时代,“自动化渗透测试”正成为企业与团队防御的标配。但传统渗透测试受限于人工经验、脚本库维护等瓶颈,如何将AI与攻防技术深度融合?Strix,便是这个领域的颠覆者。 一、Strix项目信息 项目地址:usestrix/strix 官方主页:https://usestrix.com/ 项目描述:Open-source AI agents for penetration testing 主要语言:Python Stars:16,569+ Forks:1,654+ License:Apache 2.0 热门标签:agents、artificial-intelligence、cybersecurity、llm、penetration-testing、generative-ai 二、AI Agent全自动渗透测试是什么?Strix定义了一套“智能体驱动自动渗透”流程。相比传统工具,其亮点在于: AI赋能:结合生成式AI(LLM)、多种安...
agent-lightning
人生如梦,我梦如人生。——曹雪芹《红楼梦》 Agent Lightning:AI Agent成长的绝对训练器,新世代智能体开发全解析在AI智能体(Agent)大模型与自主决策系统爆发增长的时代,如何让你的Agent又快又强、适应复杂任务并具备通用智能?微软出品的开源项目——Agent Lightning,正是为此而生的“绝对训练器”,让AI Agent全面“点亮”能力边界! 一、项目简介及核心定位 项目地址:microsoft/agent-lightning 官方主页:https://microsoft.github.io/agent-lightning/ 一句话描述:The absolute trainer to light up AI agents. 主要开发语言:Python Stars:9,283+ Forks:747+ License:MIT 关键词:agent agentic-ai llm mlops reinforcement-learning 二、Agent Lightning 如何“训练”AI智能体?Agent Lightning 是一个专注...
