AniPortrait
发表于|更新于
|浏览量:
不要阅读信手拈来的书,而要严格加以挑选,要培养自己的趣味和思维。——屠格涅夫
这个项目可以通过照片+音频生成让照片说话、唱歌的视频
目前是能跑通的,也非常有意思,注意不支持mac系统的m芯片
相关推荐
2025-09-09
parlant
天空没有留下翅膀的痕迹,但我已经飞过。――泰戈尔《飞鸟集》 https://github.com/emcie-co/parlant Parlant:让AI代理真正可控、可落地的开源大模型Agent平台随着大模型(LLM)能力的不断突破,大家都在追问一个问题:AI代理什么时候能在真实世界里“靠谱上岗”?你是否也在尝试用OpenAI、Llama3、Gemini等最新模型做自动化客服、业务流程、信息检索,却总觉得这些Agent“不可控、难落地”?今天介绍一个真正为“生产场景”而生的智能体平台 —— Parlant。 项目定位:LLM Agents for ControlParlant的定位非常鲜明:为真实世界应用而设计的可控型大模型智能体。其 Slogan 就是: LLM agents built for control. Designed for real-world use. Deployed in minutes. 可控(Control):不仅能生成内容,更能被精细调度、约束和追踪。 真实场景(Real-world use):不是玩具,不是Demo,而是为企业、产品、开...
2026-02-12
langextract
一个钟头有六十分钟,一天就超过了一千分钟。明白这个道理后,就知道人可做出多少贡献。——歌德 LangExtract:把“非结构化文本”变成“有证据的结构化数据”当我们处理临床记录、技术报告、长篇文档或业务邮件时,信息常常沉在“非结构化文本”的海洋里。你需要的不只是抽取实体,更需要“抽取结果与原文位置一一对应”,能够直观看到每个字段来自哪里,并且用交互式可视化批量审阅。Google 开源的 LangExtract 就是为此而生:它用 LLM 做结构化抽取,同时做到“精准溯源、强约束输出、长文档优化”和“一键可视化”。 仓库与文档:google/langextract · PyPI 概述(仓库描述):A Python library for extracting structured information from unstructured text using LLMs with precise source grounding and interactive visualization. 许可:Apache 2.0 技术栈:Python,支持 Gemini、Op...
2026-04-08
gallery
敏而好学,不耻下问。——孔子 Google AI Edge Gallery:把大模型请进手机里,让它在离线的掌心里开口说话有些应用天生就像展馆的馆长:灯一亮,门一开,来的人不用懂太多,就能直接上手体验未来。 Google AI Edge Gallery 就是这样的存在——它站在手机端的入口处,礼貌、骄傲、又有点迫不及待地说: 来,别光听人讲生成式 AI。把它装进你的口袋里,亲手跑一遍。 它的身份很明确: 仓库描述(description):一个画廊,展示 on-device ML/GenAI 用例,让人们可以在本地尝试并使用模型。 它更愿意这样自我介绍(README 的主旨句):Explore, Experience, and Evaluate the Future of On-Device Generative AI with Google AI Edge. 它不是论文、不是 demo 视频、不是“云端调用一次就算用过”。它是一座“随身画廊”——用手机硬件把推理跑起来,把体验交到你手里。 它想带你看的第一幅主展作品:在手机上跑开源 LLMAI Edge ...
2026-03-11
clawhub
杀了现在,也便杀了将来。——鲁迅 ClawHub:给 OpenClaw 找技能的“港口”,也是技能作者的“发布台”openclaw/clawhub 的仓库描述只有一句话,却很像一句自我介绍时递出的名片: Skill Directory for OpenClaw ClawHub 就像一个很会收纳、也很讲秩序的管理员:它把 OpenClaw 世界里的“技能(skill)”集中安置在一个公共目录里,让使用者能搜索、安装、更新;也让作者能发布、打 tag、写 changelog、把版本管理得像一套正经软件一样有脾气、有记忆。 它还有一个自己的线上门牌号: https://clawhub.ai 如果把它拟人化一点:ClawHub 像一个码头。船(技能包)从各处驶来,带着版本号、说明书、文件清单、还有它的来历;码头把它们登记、分拣、贴标、公开展示;旅人(用户)则在这里挑选、下载、装进自己的工作目录里,然后继续上路。 它的基本气质:公开可读、写入需认证,节奏由限流守护在 ClawHub 的 API v1 约定里,它把规则写得很清楚: Public read:不需要 token Writ...
2026-01-17
skills
浪费时间是一桩大罪过。——卢梭 Anthropic Skills:把“技能”装进 Claude,让代理在专业任务里更可靠当我们谈论 Agent 能力时,常常聚焦在“大模型本身”。但在真实世界的任务里,稳定产出、可复用流程和明确的边界同样关键。Anthropic 的 anthropics/skills 仓库,公开了 Claude 的技能(Skills)机制与示例:它用“技能包”的形态,把可执行的指令、脚本与资源组合在一起,让 Claude 在某类专业任务中表现更稳定、更可控。 仓库描述:Public repository for Agent Skills 技能标准参考:agentskills.io 相关文档: 什么是技能:support.claude.com - What are skills? 在 Claude 中使用技能:Using skills in Claude 如何创建自定义技能:Creating custom skills 工程解读:Equipping agents for the real world with Agent Skills Ski...
2025-12-16
ai-toolkit
追求梦想的过程,其实就是一场关于自我的修行。——乔治·希尔 AI Toolkit 深度解析:一体化扩散模型训练套件(支持 GUI 与 CLI) 仓库地址:ostris/ai-toolkit项目简介(摘自 README):AI Toolkit 是一个“一体化的扩散模型训练套件”,致力于在消费级硬件上支持“最新的图像与视频扩散模型”,既可运行为 GUI,也可运行为 CLI,并且在易用性的同时力求“功能尽可能全面”。 为什么关注 AI Toolkit?扩散模型(Diffusion Models)在图像、视频生成中的表现出众,但从“玩起来”到“用得顺手”,往往需要处理一堆细节:模型版本兼容、硬件资源局限、训练脚本与参数管理、UI 与 CLI 的协同等。 AI Toolkit 的定位非常干脆: 面向“消费级硬件”(常见的家用或轻量工作站配置); 支持“最新的扩散模型”(图像与视频领域); 既有“图形界面(GUI)”方便上手,也有“命令行(CLI)”便于批量与自动化; “易用”与“全面功能”兼顾。 如果你正在搭建自己的扩散模型训练流程,希望快速上手并保持灵活,AI To...

阿超
我的名字叫阿超 年龄25岁 家在北京市 职业是软件开发 每天最晚也会在八点前回家 不抽烟 酒浅尝辄止 晚上十二点上床 保证睡足八个小时 睡前写一篇博客 再做二十分钟俯卧撑暖身 然后再睡觉 基本能熟睡到天亮 像婴儿一样不留下任何疲劳和压力 就这样迎来第二天的早晨 健康检查结果也显示我很正常 我想说明我是一个不论何时都追求内心平稳的人 不拘泥于胜负 不纠结于烦恼 不树立使我夜不能寐的敌人 这就是我在这社会的生活态度
Follow Me公告
This is my Blog