时间的步伐有三种:未来姗姗来迟,现在像箭一样飞逝,过去永远静立不动。——席勒

Unsloth logo

Run and train AI models with a unified local interface.

FeaturesQuickstartNotebooksDocumentationDiscord

unsloth studio ui homepage

Unsloth:一只把“跑模型”和“训模型”都揽到怀里的懒懒树懒

仓库的描述很干脆,也很有野心:

Unified web UI for training and running open models like Qwen, DeepSeek, gpt-oss and Gemma locally.

他像一位“本地大管家”,不想让你在一堆工具、脚本、命令里东奔西走,于是把运行与训练开源模型这件事,收进一个统一的本地界面里。

而 README 的第二句话又给了他一个更具象的身份:

Unsloth Studio (Beta) lets you run and train text, audio, embedding, vision models on Windows, Linux and macOS.

他不止想让你“能跑”,还想让你“跑得顺、训得动、看得见、导得出”。


⭐ Features:他会做什么?先把你最需要的都准备好

Unsloth 把自己分成两面:Inference(推理)Training(训练)
像一个双面角色:一面负责把模型请来上岗,一面负责把模型拉去操练。

Inference:跑模型这件事,他很会照顾你

  • Search + download + run models:能搜索、下载、运行模型(GGUF、LoRA adapters、safetensors 都能招呼)
  • Export models:能把模型保存/导出到 GGUF、16-bit safetensors 等格式
  • Tool calling:支持 self-healing tool calling 与 web search
  • Code execution:让 LLM 在 Claude artifacts 或 sandbox 环境里“亲手试代码”
  • 自动调推理参数、可自定义 chat templates
  • 聊天时可上传图片、音频、PDF、代码、DOCX 等多种文件类型

他像一个聊天窗口里带着工具箱的工程师:你说话,他不仅回答,还能查、能跑、能修、能试。


Training:训练这件事,他更像“省显存的教练”

他在 README 里给出的训练承诺非常直接:

  • 训练 500+ models
  • 最高 2x faster
  • 最多 70% less VRAM
  • no accuracy loss

而且训练形态也不挑食:

  • full fine-tuning、pretraining
  • 4-bit、16-bit、FP8 training

再配上“训练可视化”能力:

  • Observability:实时监控训练、跟踪 loss 和 GPU 使用、可自定义图表
  • Data Recipes:从 PDF/CSV/DOCX 等自动生成数据集,并用可视化节点工作流编辑
  • Reinforcement Learning:高效 RL 库,GRPO 等使用 80% less VRAM(还提到了 FP8)

他像在训练场里喊口令的那位:
“队形我来排,装备我来省,成绩你来拿。”


⚡ Quickstart:两条路,一条 UI,一条代码

Unsloth 说得很清楚:他有两种使用方式:

  • Unsloth Studio(web UI)
  • Unsloth Core(code-based)

像两种人格:一个偏“可视化指挥官”,一个偏“代码派工程师”。


Unsloth Studio(web UI):把控制台变成一间训练室

Unsloth Studio (Beta) 支持 Windows / Linux / WSL / macOS

他还把不同硬件的状态说得明明白白:

  • CPU:当前支持 Chat 与 Data Recipes
  • NVIDIA:训练可用(RTX 30/40/50、Blackwell、DGX Spark、Station 等)
  • macOS:目前支持 chat 与 Data Recipes,MLX training “coming very soon”
  • AMD:Chat 可用;训练可用 Unsloth Core;Studio 支持 coming soon
  • Coming soon:Apple MLX、AMD、Intel 的训练支持
  • Multi-GPU:现在可用,重大升级在路上

他像一位诚实的店长:能做的现在就做,不能做的给你时间表(哪怕是“very soon”)。


macOS / Linux / WSL:一条命令把他叫醒

1
curl -fsSL https://raw.githubusercontent.com/unslothai/unsloth/main/install.sh | sh

如果没有 curl,README 说可以用 wget
装好之后启动:

1
2
source unsloth_studio/bin/activate
unsloth studio -H 0.0.0.0 -p 8888

他像在说:
“你把门牌号写好(host/port),我就在 8888 开门营业。”


Windows:PowerShell 也能一键开张

安装:

1
irm https://raw.githubusercontent.com/unslothai/unsloth/main/install.ps1 | iex

���动:

1
& .\unsloth_studio\Scripts\unsloth.exe studio -H 0.0.0.0 -p 8888

Docker:把他装进容器,连带工作目录一起带走

README 给出的 Docker 启动方式很标准,也很“全家桶”:

1
2
3
4
5
docker run -d -e JUPYTER_PASSWORD="mypassword" \
-p 8888:8888 -p 8000:8000 -p 2222:22 \
-v $(pwd)/work:/workspace/work \
--gpus all \
unsloth/unsloth
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
他甚至把 “JUPYTER_PASSWORD” 都替你留好了位置——像给你递上钥匙的房东。

---

## Developer installs:用 uv 更利落地把 Studio 装起来

### macOS / Linux / WSL developer installs

```bash
curl -LsSf https://astral.sh/uv/install.sh | sh
uv venv unsloth_studio --python 3.13
source unsloth_studio/bin/activate
uv pip install unsloth --torch-backend=auto
unsloth studio setup
unsloth studio -H 0.0.0.0 -p 8888

Windows PowerShell developer installs

1
2
3
4
5
6
7
winget install -e --id Python.Python.3.13
winget install --id=astral-sh.uv -e
uv venv unsloth_studio --python 3.13
.\unsloth_studio\Scripts\activate
uv pip install unsloth --torch-backend=auto
unsloth studio setup
unsloth studio -H 0.0.0.0 -p 8888

他像一个效率控:环境创建、依赖安装、后端选择(--torch-backend=auto)都给你安排得丝滑。


Nightly:想追最新?他也准备了“边跑边追风”的路线

Nightly - MacOS / Linux / WSL

1
2
3
4
5
6
7
8
curl -LsSf https://astral.sh/uv/install.sh | sh
git clone --filter=blob:none https://github.com/unslothai/unsloth.git unsloth_studio
cd unsloth_studio
uv venv --python 3.13
source .venv/bin/activate
uv pip install -e . --torch-backend=auto
unsloth studio setup
unsloth studio -H 0.0.0.0 -p 8888

以后每次启动:

1
2
3
cd unsloth_studio
source .venv/bin/activate
unsloth studio -H 0.0.0.0 -p 8888

Nightly - Windows

1
2
3
4
5
6
7
8
9
winget install -e --id Python.Python.3.13
winget install --id=astral-sh.uv -e
git clone --filter=blob:none https://github.com/unslothai/unsloth.git unsloth_studio
cd unsloth_studio
uv venv --python 3.13
.\.venv\Scripts\activate
uv pip install -e . --torch-backend=auto
unsloth studio setup
unsloth studio -H 0.0.0.0 -p 8888

以后每次启动:

1
2
3
cd unsloth_studio
.\.venv\Scripts\activate
unsloth studio -H 0.0.0.0 -p 8888

他像一个“夜班营业员”:你想要最新功能?可以,跟我来走夜路。


Unsloth Core(code-based):更偏工程师的那一面

Linux / WSL

1
2
3
4
curl -LsSf https://astral.sh/uv/install.sh | sh
uv venv unsloth_env --python 3.13
source unsloth_env/bin/activate
uv pip install unsloth --torch-backend=auto

Windows

1
2
3
4
5
winget install -e --id Python.Python.3.13
winget install --id=astral-sh.uv -e
uv venv unsloth_env --python 3.13
.\unsloth_env\Scripts\activate
uv pip install unsloth --torch-backend=auto

README 也提醒:Windows 下直接 pip install unsloth 只有在你已经装好 PyTorch 时才好用,并给出 Windows Guide。


AMD / Intel:他也没把你落下

README 指向了对应安装指南:

  • AMD Guide
  • Intel Guide

并提到对于 RTX 50x、B200、6000 GPUs 可以用:

uv pip install unsloth --torch-backend=auto

还提供 Blackwell 与 DGX Spark 的相关指南链接。


✨ Free Notebooks:他甚至把“免费训练”也端上桌

Unsloth 说:你可以用他们的 notebooks 免费训练,流程是:

Add dataset, run, then deploy your trained model.

并给出一张“模型 / 免费 notebook / 性能 / 显存占用”的表格(例如 Qwen3.5、gpt-oss、Gemma、embeddinggemma、Orpheus-TTS 等),同时也给了索引入口:

  • Kaggle notebooks
  • GRPO notebooks
  • TTS notebooks
  • embedding & Vision notebooks
  • all models / all notebooks / docs

他像一个把训练场开放给大众的教练:
“先来练,练好了再去部署上场。”


🦥 Unsloth News:他还在不断长出新技能

README 的 News 像一份“树懒日报”,列了不少方向:

  • Introducing Unsloth Studio(新的 web UI)
  • Qwen3.5 多规格模型支持
  • MoE LLMs 更快训练
  • embedding fine-tuning 加速
  • 更长上下文 RL
  • 更快训练的 Triton kernels、padding free、packing
  • 500K context 训练
  • FP8 & Vision RL
  • gpt-oss 相关 RL、Flex Attention、Guide

他不是一个静态工具,而是一只一直在进化、一直在加速的树懒。


🔗 Links and Resources:他给你所有出口,不让你迷路

Type Links
r/unsloth Reddit Join Reddit community
Documentation & Wiki Read Our Docs
Twitter (aka X) Follow us on X
Installation Pip & Docker Install
Our Models Unsloth Catalog
Blog Read our Blogs

Citation:如果你要在论文或报告里提到他

1
2
3
4
5
6
@software{unsloth,
author = {Daniel Han, Michael Han and Unsloth team},
title = {Unsloth},
url = {https://github.com/unslothai/unsloth},
year = {2023}
}

License:他一边开源,一边也保护自己的“工作室”

Unsloth 使用 Apache 2.0 + AGPL-3.0 的双许可证模式:

  • 核心 Unsloth package:Apache 2.0
  • 部分可选组件(如 Unsloth Studio UI):AGPL-3.0

他像在说:
“核心能力尽量开放给生态;而对 UI 等部分,我也要用合适的方式保证持续投入。”


Thank You to:他知道自己不是一个人跑出来的

README 里他很认真地感谢了这些伙伴:

  • llama.cpp:让用户能运行与保存模型
  • Hugging Face:transformers 与 TRL
  • PyTorch 与 Torch AO 团队
  • NVIDIA:NeMo DataDesigner 与贡献
  • 每一个贡献者与使用者

他把“生态”这个词,写得像人情味。