时间的步伐有三种：未来姗姗来迟，现在像箭一样飞逝，过去永远静立不动。——席勒

Run and train AI models with a unified local interface.

Features • Quickstart • Notebooks • Documentation • Discord

Unsloth：一只把“跑模型”和“训模型”都揽到怀里的懒懒树懒

仓库的描述很干脆，也很有野心：

Unified web UI for training and running open models like Qwen, DeepSeek, gpt-oss and Gemma locally.

他像一位“本地大管家”，不想让你在一堆工具、脚本、命令里东奔西走，于是把运行与训练开源模型这件事，收进一个统一的本地界面里。

而 README 的第二句话又给了他一个更具象的身份：

Unsloth Studio (Beta) lets you run and train text, audio, embedding, vision models on Windows, Linux and macOS.

他不止想让你“能跑”，还想让你“跑得顺、训得动、看得见、导得出”。

⭐ Features：他会做什么？先把你最需要的都准备好

Unsloth 把自己分成两面：Inference（推理） 与 Training（训练）。
像一个双面角色：一面负责把模型请来上岗，一面负责把模型拉去操练。

Inference：跑模型这件事，他很会照顾你

Search + download + run models：能搜索、下载、运行模型（GGUF、LoRA adapters、safetensors 都能招呼）
Export models：能把模型保存/导出到 GGUF、16-bit safetensors 等格式
Tool calling：支持 self-healing tool calling 与 web search
Code execution：让 LLM 在 Claude artifacts 或 sandbox 环境里“亲手试代码”
自动调推理参数、可自定义 chat templates
聊天时可上传图片、音频、PDF、代码、DOCX 等多种文件类型

他像一个聊天窗口里带着工具箱的工程师：你说话，他不仅回答，还能查、能跑、能修、能试。

Training：训练这件事，他更像“省显存的教练”

他在 README 里给出的训练承诺非常直接：

训练 500+ models
最高 2x faster
最多 70% less VRAM
no accuracy loss

而且训练形态也不挑食：

full fine-tuning、pretraining
4-bit、16-bit、FP8 training

再配上“训练可视化”能力：

Observability：实时监控训练、跟踪 loss 和 GPU 使用、可自定义图表
Data Recipes：从 PDF/CSV/DOCX 等自动生成数据集，并用可视化节点工作流编辑
Reinforcement Learning：高效 RL 库，GRPO 等使用 80% less VRAM（还提到了 FP8）

他像在训练场里喊口令的那位：
“队形我来排，装备我来省，成绩你来拿。”

⚡ Quickstart：两条路，一条 UI，一条代码

Unsloth 说得很清楚：他有两种使用方式：

Unsloth Studio（web UI）
Unsloth Core（code-based）

像两种人格：一个偏“可视化指挥官”，一个偏“代码派工程师”。

Unsloth Studio（web UI）：把控制台变成一间训练室

Unsloth Studio (Beta) 支持 Windows / Linux / WSL / macOS。

他还把不同硬件的状态说得明明白白：

CPU：当前支持 Chat 与 Data Recipes
NVIDIA：训练可用（RTX 30/40/50、Blackwell、DGX Spark、Station 等）
macOS：目前支持 chat 与 Data Recipes，MLX training “coming very soon”
AMD：Chat 可用；训练可用 Unsloth Core；Studio 支持 coming soon
Coming soon：Apple MLX、AMD、Intel 的训练支持
Multi-GPU：现在可用，重大升级在路上

他像一位诚实的店长：能做的现在就做，不能做的给你时间表（哪怕是“very soon”）。

macOS / Linux / WSL：一条命令把他叫醒

1	curl -fsSL https://raw.githubusercontent.com/unslothai/unsloth/main/install.sh \| sh

如果没有 curl，README 说可以用 wget。
装好之后启动：

1 2	source unsloth_studio/bin/activate unsloth studio -H 0.0.0.0 -p 8888

他像在说：
“你把门牌号写好（host/port），我就在 8888 开门营业。”

Windows：PowerShell 也能一键开张

安装：

1	irm https://raw.githubusercontent.com/unslothai/unsloth/main/install.ps1 \| iex

��动：

1	& .\unsloth_studio\Scripts\unsloth.exe studio -H 0.0.0.0 -p 8888

Docker：把他装进容器，连带工作目录一起带走

README 给出的 Docker 启动方式很标准，也很“全家桶”：

docker run -d -e JUPYTER_PASSWORD="mypassword" \
  -p 8888:8888 -p 8000:8000 -p 2222:22 \
  -v $(pwd)/work:/workspace/work \
  --gpus all \
  unsloth/unsloth

他甚至把 “JUPYTER_PASSWORD” 都替你留好了位置——像给你递上钥匙的房东。

---

## Developer installs：用 uv 更利落地把 Studio 装起来

### macOS / Linux / WSL developer installs

```bash
curl -LsSf https://astral.sh/uv/install.sh | sh
uv venv unsloth_studio --python 3.13
source unsloth_studio/bin/activate
uv pip install unsloth --torch-backend=auto
unsloth studio setup
unsloth studio -H 0.0.0.0 -p 8888

Windows PowerShell developer installs

winget install -e --id Python.Python.3.13
winget install --id=astral-sh.uv  -e
uv venv unsloth_studio --python 3.13
.\unsloth_studio\Scripts\activate
uv pip install unsloth --torch-backend=auto
unsloth studio setup
unsloth studio -H 0.0.0.0 -p 8888

他像一个效率控：环境创建、依赖安装、后端选择（--torch-backend=auto）都给你安排得丝滑。

Nightly：想追最新？他也准备了“边跑边追风”的路线

Nightly - MacOS / Linux / WSL

curl -LsSf https://astral.sh/uv/install.sh | sh
git clone --filter=blob:none https://github.com/unslothai/unsloth.git unsloth_studio
cd unsloth_studio
uv venv --python 3.13
source .venv/bin/activate
uv pip install -e . --torch-backend=auto
unsloth studio setup
unsloth studio -H 0.0.0.0 -p 8888

以后每次启动：

1
2
3

cd unsloth_studio
source .venv/bin/activate
unsloth studio -H 0.0.0.0 -p 8888

Nightly - Windows

winget install -e --id Python.Python.3.13
winget install --id=astral-sh.uv  -e
git clone --filter=blob:none https://github.com/unslothai/unsloth.git unsloth_studio
cd unsloth_studio
uv venv --python 3.13
.\.venv\Scripts\activate
uv pip install -e . --torch-backend=auto
unsloth studio setup
unsloth studio -H 0.0.0.0 -p 8888

以后每次启动：

1
2
3

cd unsloth_studio
.\.venv\Scripts\activate
unsloth studio -H 0.0.0.0 -p 8888

他像一个“夜班营业员”：你想要最新功能？可以，跟我来走夜路。

Unsloth Core（code-based）：更偏工程师的那一面

Linux / WSL

curl -LsSf https://astral.sh/uv/install.sh | sh
uv venv unsloth_env --python 3.13
source unsloth_env/bin/activate
uv pip install unsloth --torch-backend=auto

Windows

winget install -e --id Python.Python.3.13
winget install --id=astral-sh.uv  -e
uv venv unsloth_env --python 3.13
.\unsloth_env\Scripts\activate
uv pip install unsloth --torch-backend=auto

README 也提醒：Windows 下直接 pip install unsloth 只有在你已经装好 PyTorch 时才好用，并给出 Windows Guide。

AMD / Intel：他也没把你落下

README 指向了对应安装指南：

AMD Guide
Intel Guide

并提到对于 RTX 50x、B200、6000 GPUs 可以用：

uv pip install unsloth --torch-backend=auto

还提供 Blackwell 与 DGX Spark 的相关指南链接。

✨ Free Notebooks：他甚至把“免费训练”也端上桌

Unsloth 说：你可以用他们的 notebooks 免费训练，流程是：

Add dataset, run, then deploy your trained model.

并给出一张“模型 / 免费 notebook / 性能 / 显存占用”的表格（例如 Qwen3.5、gpt-oss、Gemma、embeddinggemma、Orpheus-TTS 等），同时也给了索引入口：

Kaggle notebooks
GRPO notebooks
TTS notebooks
embedding & Vision notebooks
all models / all notebooks / docs

他像一个把训练场开放给大众的教练：
“先来练，练好了再去部署上场。”

🦥 Unsloth News：他还在不断长出新技能

README 的 News 像一份“树懒日报”，列了不少方向：

Introducing Unsloth Studio（新的 web UI）
Qwen3.5 多规格模型支持
MoE LLMs 更快训练
embedding fine-tuning 加速
更长上下文 RL
更快训练的 Triton kernels、padding free、packing
500K context 训练
FP8 & Vision RL
gpt-oss 相关 RL、Flex Attention、Guide

他不是一个静态工具，而是一只一直在进化、一直在加速的树懒。

🔗 Links and Resources：他给你所有出口，不让你迷路

Type	Links
r/unsloth Reddit	Join Reddit community
Documentation & Wiki	Read Our Docs
Twitter (aka X)	Follow us on X
Installation	Pip & Docker Install
Our Models	Unsloth Catalog
Blog	Read our Blogs

Citation：如果你要在论文或报告里提到他

@software{unsloth,
  author = {Daniel Han, Michael Han and Unsloth team},
  title = {Unsloth},
  url = {https://github.com/unslothai/unsloth},
  year = {2023}
}

License：他一边开源，一边也保护自己的“工作室”

Unsloth 使用 Apache 2.0 + AGPL-3.0 的双许可证模式：

核心 Unsloth package：Apache 2.0
部分可选组件（如 Unsloth Studio UI）：AGPL-3.0

他像在说：
“核心能力尽量开放给生态；而对 UI 等部分，我也要用合适的方式保证持续投入。”

Thank You to：他知道自己不是一个人跑出来的

README 里他很认真地感谢了这些伙伴：

llama.cpp：让用户能运行与保存模型
Hugging Face：transformers 与 TRL
PyTorch 与 Torch AO 团队
NVIDIA：NeMo DataDesigner 与贡献
每一个贡献者与使用者

他把“生态”这个词，写得像人情味。

python

相关推荐

2025-09-28

yt-dlp

没有绝望的处境，只有对处境绝望的人。——哈尔西 yt-dlp：功能最强大的命令行视频/音频下载神器在互联网内容爆发的今天，“保存”与“离线”依旧是刚需。无论你是视频发烧友、音频收集癖，还是开发者、数据分析师，只要你想批量下载和管理来自 YouTube、Bilibili、Twitter 等主流平台的音视频内容，yt-dlp 都是你的不二之选！一、项目简介项目地址：yt-dlp/yt-dlp 一句话描述：A feature-rich command-line audio/video downloader 主要语言：Python Stars：128,467+ Forks：10,292+ 标签：cli downloader youtube-downloader sponsorblock python 开源协议：The Unlicense 官网/社区：Discord 二、yt-dlp 能做什么？1. 支持超多主流网站内置数百个网站适配器，主流视频网站（如 YouTube、Bilibili、Twitter、TikTok、SoundClo...

2024-09-27

python包管理Rye

教育的目的应当教人如何思考，而非思考些什么；应为增进我们的心智，是我们能自行思考，而不是将别人的思考作为我们记忆的负担。——斯宾诺塞 Rye 是适用于 Python 的综合项目和包管理解决方案。Rye 的创建者希望为所有 Python 用户建立一站式服务，它提供了一种统一的体验，可以无缝地安装和管理 Python 安装、基于 pyproject.toml 的项目、依赖项和虚拟环境。它旨在适应复杂的项目、monorepo 并促进全球工具安装。好奇？观看简介。 github： https://github.com/astral-sh/rye 官方文档： https://rye.astral.sh/ 安装、使用： 1234567891011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545556575859606162636465666768697071727374757677787980818283848586878889909192939495969798...

2026-01-19

nautilus_trader

今天所做之事勿候明天，自己所做之事勿候他人。——歌德 NautilusTrader：高性能、可生产落地的算法交易平台与事件驱动回测引擎NautilusTrader 是一个开源、面向生产的高性能算法交易平台。它让量化交易者可以在同一套事件驱动的引擎里，既对历史数据做组合级回测，也能将同一份策略代码直接部署到实盘环境，无需重写。平台以 Python 为一等公民，以 Rust 为高性能内核，强调正确性、安全性与工程可维护性，在多资产、多市场、多数据源的真实环境中尽量降低操作与实现层面的风险。官方站点与文档 Docs: https://nautilustrader.io/docs/ Website: https://nautilustrader.io Discord: https://discord.gg/NautilusTrader 仓库与许可 Repo: https://github.com/nautechsystems/nautilus_trader License: LGPL-3.0 它要解决什么问题研究到实盘的“同构一致性”回测与实盘常常使用完全不同的技术...

2024-09-10

domain-admin

教师的影响是永久的。教师绝不能停止自我感化。——亚当斯 github： https://github.com/dromara/domain-admin 官方文档： Domain Admin — Domain Admin latest 文档基于Python + Vue3.js 技术栈实现的域名和SSL证书监测平台用于解决，不同业务域名SSL证书，申请自不同的平台，到期后不能及时收到通知，导致线上访问异常，被老板责骂的问题 Domain Admin是一个轻量级监控方案，占用系统资源较少。同时，Domain Admin也可以作为一个Flask 和 Vue.js前后端分离的项目模板功能描述核心功能：域名、SSL证书和托管证书文件的过期监控，到期提醒支持证书：单域名证书、多域名证书、泛域名（通配符）证书、IP证书、自签名证书证书部署：单一主机部署、多主机部署、动态主机部署通知渠道：支持邮件、Webhook、企业微信、钉钉、飞书等通知方式支持平台：macOS、Linux、Windows 辅助功能：Let’s Encrypt SSL证书免费申请和SSL...

2025-08-02

Umi-OCR

我们一直寻找的，却是自己原本早已拥有的，我们总是东张西望，唯恐漏了自己想要的，这就是我们至今难以如愿以偿的原因。——柏拉图《理想国》 https://github.com/hiroi-sora/Umi-OCR Umi-OCR：免费、开源、离线批量文字识别神器，让你的图片秒变文本！你是否被图片、扫描件里的文字抓狂过？有没有想过能有一款工具，不用联网、完全免费，还能批量、极速地帮你从图片里提取出所有文字？Umi-OCR，就是这样一款专为效率达人、办公党、学习者量身打造的开源OCR利器！什么是Umi-OCR？Umi-OCR 是一款免费开源、可批量处理的离线OCR（光学字符识别）软件，适用于 Windows 7 x64 和 Linux x64。它主打“零门槛上手、极致效率体验”：解压即用、无需联网，所有识别任务本地完成，保护你的隐私安全。项目主页：hiroi-sora/Umi-OCR on GitHub稳定下载：点此进入发行版页面为什么选择Umi-OCR？完全免费&开源：所有代码公开透明，个人和组织均可免费使用。即开即用：无需安装、注册，解压包即可...

2025-08-19

LLMs-from-scratch

万物各得其和以生,各得其养以成。一一《荀子》从零构建大型语言模型：深度解析「LLMs-from-scratch」项目在人工智能的浪潮中，诸如 GPT、Llama、Gemini 等大型语言模型（LLMs）正在不断刷新人们对机器智能的认知。许多开发者和研究者都渴望揭开大模型的“神秘面纱”，但面对庞大的工程、复杂的代码和晦涩的原理，往往望而却步。如果你希望“亲手从零实现一个 LLM”，学习底层机制、掌握每一步细节，那么你一定要关注由 Sebastian Raschka 维护的开源项目——LLMs-from-scratch。本文将带你深度解读该项目的核心内容、架构特色、学习价值和应用前景，帮助你用最纯粹的方式，真正“理解、动手、掌控”大语言模型！一、项目简介与定位LLMs-from-scratch 是一个面向学习者的「逐步构建大型语言模型」的开源教程与代码库。它覆盖了从基础的神经网络原理，到现代 Transformer 架构，再到分布式训练、模型推理、微调等全部核心环节。项目以“自底向上”的方式，帮助你真正实现和理解 LLM 的全部关键技术。项目地址：https://gi...

阿超

我的名字叫阿超年龄25岁家在北京市职业是软件开发每天最晚也会在八点前回家不抽烟酒浅尝辄止晚上十二点上床保证睡足八个小时睡前写一篇博客再做二十分钟俯卧撑暖身然后再睡觉基本能熟睡到天亮像婴儿一样不留下任何疲劳和压力就这样迎来第二天的早晨健康检查结果也显示我很正常我想说明我是一个不论何时都追求内心平稳的人不拘泥于胜负不纠结于烦恼不树立使我夜不能寐的敌人这就是我在这社会的生活态度