modular

发表于2024-05-24|更新于2026-02-24

|浏览量:

读书有三到：谓心到、眼到、口到。——朱熹

https://www.modular.com/

在linux中运行

1	curl -s https://get.modular.com \| sh -

MAX 提供了一个统一且可扩展的平台，其中包括将低延迟、高吞吐量的 AI 推理管道部署到生产中所需的一切。

无需任何代码即可对任何模型进行基准测试

使用简单的命令行工具通过 MLPerf 执行 MAX Engine 中的任何模型。

使用 Mojo 编写自定义操作

为您的模型创建自定义操作，并与图表的其余部分一起进行优化。

在 Triton 中启动推理服务

在容器中尝试 MAX Serving 并响应来自 HTTP/gRPC 客户端的推理请求。

编写使用 Python 的 Mojo 代码

了解如何编写与 NumPy 和 Matplotlib 等 Python 包互操作的 Mojo 代码。

尝试 Llama2 或稳定扩散

查看我们使用各种模型运行推理的代码示例。

在浏览器中开始使用 Mojo 进行编码

请访问此网站内置的 Mojo 编码游乐场。没有什么可安装的。

从 Python 运行现有模型

了解如何使用 PyTorch、TensorFlow 或 ONNX 中的模型运行推理。

在 Mojo 中构建推理图

了解如何使用 MAX Graph API 在 Mojo 中构建高性能推理图。

相关推荐

当许多人在一条路上徘徊不前时，他们不得不让开一条大路，让那珍惜时间的人赶到他们的前面去。——苏格拉底探索 Superpowers：为您的编程代理开放无限可能Superpowers 是一个“核心技能库”，其目标是让编程代理（如 Claude Code 或 Codex）真正拥有“超能力”。它提供了一整套可组合的“技能”和任务驱动的高效工作流，让代理从“发任务”成长为一个具备团队协作能力的小助手。而最迷人的地方在于，这些超能力就是一套贯穿项目全生命周期的工作流，从想法的诞生，到代码的实现，再到测试和代码审查，一切都秩序井然、自动高效。如果你是一个对 AI coding agent 充满期待的开发者，Superpowers 不只是工具，它是你的“幕后工作流操盘手”。 Superpowers 的独特亮点超能力：7 步助力全周期开发Superpowers 彻底重塑了工作的节奏与内容。以下是基本工作流概览：头脑风暴（brainstorming）在任何代码行写下之前，Superpowers 的技能会引导你梳理想法、排布需求，并生成设计文档。 Git 工作树的使用设计定稿后，创建独...

自尊不是轻人，自信不是自满，独立不是孤立。——徐特立 HumanLayer：AI Coding Agents 解决复杂代码难题的最优解在 AI 编码逐步普及的今天，很多开发者都遇到这样的问题：大模型/AI助手能帮你写函数、补代码，但当代码库足够复杂、系统庞大时，AI就容易“迷路”或者给出不靠谱的方案。有没有一套系统，能让 AI Coding Agents 真正高效地解决大型复杂代码库中的难题？——HumanLayer 就是为此而生的！一、项目简介项目地址：humanlayer/humanlayer 官网：https://humanlayer.dev/code 一句话描述：The best way to get AI coding agents to solve hard problems in complex codebases. 主语言：TypeScript Stars：4387+ Forks：341+ 标签：agents ai llm human-in-the-loop opencode codex claude-code 二、HumanLa...

一个人在学校里表面上的成绩，以及较高的名次，都是靠不住的，唯一的要点是你对于你所学的是否心里真正觉得很喜欢，是否真有浓厚的兴趣。——邹韬奋 https://github.com/xming521/WeClone/ https://www.weclone.love/ WeClone：基于聊天历史一站式创造你的数字分身WeClone 是一个极具创新性的开源项目，致力于为用户提供“从聊天记录生成数字分身”的一站式解决方案。它不仅支持基于个人历史对话微调大模型（LLM），让 AI 聊天机器人具备你独特的表达风格和知识结构，还能实现数字分身的多平台部署和多模态交互，助力每个人拥有自己的“AI 数字自我”。一、项目愿景与定位WeClone 并不是传统意义上的 IM 或简单的聊天机器人，而是一个围绕“数字分身”理念构建的完整生态：打造属于你的数字分身：通过收集、整理你的聊天历史，结合大模型微调，让 AI 能够最大程度还原你的语言习惯、知识体系和个性表达。一站式流程体验：涵盖数据清洗、格式转换、微调训练、分身生成、多端集成等全流程自动化，普通用户也能轻松上手。多场景应用：分身...

生命不等于是呼吸，生命是活动。——卢梭 https://github.com/Cinnamon/kotaemon Kotaemon：开源RAG聊天神器，让你的文档变成“会答题”的智能体在AI与大模型蓬勃发展的今天，RAG（Retrieval-Augmented Generation，检索增强生成）技术已经成为“知识问答”领域的热门。你是否曾想过，能不能像ChatGPT一样，直接“和自己的文档聊天”？无论是PDF、Word、表格还是PPT，随时提问，让AI帮你找答案、做摘要、智能检索？这，就是 Kotaemon 要解决的问题！Kotaemon 是一个开源、可定制、极简UI的RAG工具，让你随时随地“和自己的资料对话”，支持本地和云端大模型，既适合小白用户也适合AI开发者二次开发。项目定位：文档聊天的RAG一站式解决方案Kotaemon 的定位非常清晰：开源、支持多模型、极简界面的文档聊天工具和开发框架。你可以像用ChatGPT那样，对自己的文件提问，得到准确、有出处的答案。开发者可以用它做RAG管线的快速原型/定制开发。支持多用户、私有...

如果你想要改变世界，先改变你自己。——圣雄甘地 Open-AutoGLM 与 Phone Agent：把“会用手机”的 AI 真正带到你的桌面在移动端的真实世界里，很多任务都需要“看懂屏幕 + 点按滑动 + 输入搜索 + 等待跳转”。Open-AutoGLM 的 Phone Agent 正是为此而生：它基于多模态视觉语言模型（VLM）理解手机屏幕内容，通过 ADB 远程操控设备，自动完成从意图解析到动作执行的完整流程。你只需用自然语言提出需求，例如“打开美团搜索附近的火锅店”，Agent 即会理解当前界面、规划步骤、执行操作、并在敏感场景请求确认或人工接管，保障安全与可控。仓库地址：zai-org/Open-AutoGLM README（本文内容基于此）：README.md 模型下载： AutoGLM-Phone-9B（中文应用优化）： Hugging Face ModelScope AutoGLM-Phone-9B-Multilingual（支持英文场景）： Hugging Face ModelScope 相关部署参考：与 GLM-4.1V-9B-...

穷则变，变则通，通则久。一一《周易》 https://github.com/MeiGen-AI/MultiTalk https://meigen-ai.github.io/multi-talk/ MultiTalk：让虚拟人“开口对话”的多角色音驱动视频生成新范式MultiTalk 是一项前沿的开源项目，聚焦于“音频驱动多角色对话视频生成”。它能根据多路音频、参考图片和文本提示，自动生成多个人物参与的对话、唱歌、互动等高清视频片段。这不仅极大拓展了 AIGC（AI生成内容）的边界，也为虚拟人、数字分身、虚拟主播、影视娱乐等领域带来了全新解决方案。一、项目简介与特色亮点MultiTalk 提出的关键创新点在于：支持多角色同步出镜和对话，不仅能生成单人说话，还能让多个虚拟人“你一句我一句”地自然交流。音频驱动，只需输入每个人的音频流，就能精准合成口型和动作，生成高度真实的对话或唱歌视频片段。强交互，可通过文本 prompt 控制每个人物的行为、情绪、互动方式，实现虚拟角色的灵活“导演”。适应多风格，不仅支持真人，还能生成卡通、虚拟形象，适用多种应用场景。分辨率...

阿超

我的名字叫阿超年龄25岁家在北京市职业是软件开发每天最晚也会在八点前回家不抽烟酒浅尝辄止晚上十二点上床保证睡足八个小时睡前写一篇博客再做二十分钟俯卧撑暖身然后再睡觉基本能熟睡到天亮像婴儿一样不留下任何疲劳和压力就这样迎来第二天的早晨健康检查结果也显示我很正常我想说明我是一个不论何时都追求内心平稳的人不拘泥于胜负不纠结于烦恼不树立使我夜不能寐的敌人这就是我在这社会的生活态度

数据加载中