在观察的领域中,机遇只偏爱那种有准备的头脑。——巴斯德

https://github.com/mukul975/Anthropic-Cybersecurity-Skills

当 AI 安全分析师开始成建制上岗:Anthropic-Cybersecurity-Skills,正在把网络安全经验变成可调用的技能库

如果说大模型是会思考的大脑,那么在网络安全世界里,它最缺的,从来不是“会不会说”,而是“会不会干”。

它可能会解释什么是凭证窃取,知道什么叫 Kerberoasting,也能头头是道地聊一通威胁狩猎、云取证和 SIEM 告警关联。但真到现场,面对一份可疑内存转储、一个横跨多云环境的入侵事件,或者一条需要一步步落地执行的检测流程,很多 AI 还是会暴露出同一个短板:懂一点术语,却没有经过真正训练的“安全手感”。

Anthropic-Cybersecurity-Skills 这个项目,干的就是一件非常硬核、也非常有时代感的事:

给 AI agent 配上一整套接近资深安全分析师水平的结构化网络安全技能。

它不是教程堆,也不是脚本杂货铺,更不是一堆零散的 payload、字典和 exploit 集合。它更像是一所把经验、流程、框架映射、验证方法全部系统化的安全训练学院。你把 AI agent 送进来,它出来的时候,不再只是一个会说安全术语的聊天对象,而像是被发了一套真正能上场的作战手册。

它到底是什么

从仓库描述开始,这个项目就把自己的身份说得很清楚:

它是一个面向 AI agents 的、754 个结构化网络安全技能组成的开源技能库,覆盖 26 个安全领域,映射到 5 套框架,遵循 agentskills.io 标准,并且能够和 Claude Code、GitHub Copilot、Codex CLI、Cursor、Gemini CLI 以及 20 多个平台协同工作。

这个描述本身就很有冲击力。

因为它不是在卖一个“AI 安全概念”,而是在明确告诉你:这里不是聊未来的地方,这里已经把技能、标准、兼容性、框架映射和落地形式全部摆好了。

你可以把 Anthropic-Cybersecurity-Skills 想象成一个巨大的安全军械库,但它存放的不是武器,而是被整理得极其规整的安全经验。每一项技能都像一位训练有素的老分析师,站在自己的岗位上,等着 AI agent 来敲门:

你想做内存取证?来,我告诉你什么时候该用这个方法、要准备什么、按什么步骤做、做完怎么验证。
你想做威胁狩猎?来,我把假设驱动流程、行为分析线索和验证口径都给你摆平。
你想搞云安全、SOC 运营、API 安全、恶意软件分析、渗透测试?别急,一个一个来,每个人都带着工牌。

这个项目最有魅力的地方,是它不是给人看的“安全资料”,而是给 AI 用的“安全技能”

这一点非常重要。

很多安全仓库其实也很有价值,但它们更像是资料库、工具箱、文章归档或者 PoC 集合。人类安全工程师打开之后,能靠经验去挑、去理解、去拼装。

但 AI agent 不一样。

AI agent 需要的不是“信息很多”,而是“结构清楚、触发条件明确、工作流可执行、结果可验证”。Anthropic-Cybersecurity-Skills 恰恰就是按这个思路设计出来的。它不是在说“我知道很多安全知识”,而是在说:

我会把这些知识整理成 agent 真能调用、真能执行、真能校验的技能。

README 里甚至直接点出这个项目的目标:Give any AI agent the security skills of a senior analyst

这句话很有力量,因为它说的不是把 AI 变成一本安全百科,而是把 AI 训练成一个会办案的人。

它为什么会出现

这个项目存在的理由,其实非常现实。

README 里提到,2024 年全球网络安全人才缺口达到 480 万个未填补岗位。这不是一个抽象数字,这是一大片真实存在的疲惫:告警过载、事件响应人手不够、威胁分析时间被切碎、初级分析师成长速度赶不上攻击面的膨胀。

AI agent 当然可能帮上忙,但前提是它不能只是“会总结报告”,而要真正具备结构化的安全操作知识。

也正因为如此,这个项目明确区分了自己和传统安全资源库的不同。README 说得很直白:现有很多安全工具仓库给你的是字典、payload 或 exploit code,但并没有把一位资深分析师在真实场景中的决策流程和执行方法交给 AI。

Anthropic-Cybersecurity-Skills 想补上的,正是这块空白。

它就像一位很清醒的总教官,看着一群语言能力很强、但现场经验不足的 AI agent,摇摇头,然后把袖子一卷说:

“术语背得再熟也不算上岗,来,先学流程。”

五套框架映射,让它像一位懂技术也懂合规的老兵

这个项目最亮眼的一点,是它并不是只做“技能集合”,还把每一项技能映射到了五大框架中:

  • MITRE ATT&CK
  • NIST CSF 2.0
  • MITRE ATLAS
  • MITRE D3FEND
  • NIST AI RMF

这件事的含金量非常高。

因为在真实安全工作里,大家从来不是只围着一个技术动作打转。安全团队要考虑攻击技术、检测逻辑、防御措施、组织能力、AI 风险管理,很多时候还要同时面对内部运营、外部审计和治理要求。

Anthropic-Cybersecurity-Skills 在这里的表现,就像一个同时会攻防语言、治理语言、AI 风险语言的多面手。

README 里甚至给了一个非常形象的例子:一个技能 analyzing-network-traffic-of-malware,可以同时映射到 ATT&CK、NIST CSF、ATLAS、D3FEND 和 AI RMF。也就是说,一项技能不只是“一段操作步骤”,它还是多套框架中的一个坐标点。

这种设计让它不只是能让 AI agent“做事”,还能让 AI agent在做事时顺带懂得“这件事在框架里算什么、站在哪个位置、和哪些治理要求相关”。

这像极了一位资深安全顾问:既能下场抓包,也能抬头看全局。

26 个安全领域,像 26 支轮值待命的战队

这个项目目前覆盖 26 个安全领域,而且不是轻描淡写地蹭个标签,而是实打实地分布了大量技能。光看这些领域,就已经能感受到它的野心和密度:

  • Cloud Security
  • Threat Hunting
  • Threat Intelligence
  • Web Application Security
  • Network Security
  • Malware Analysis
  • Digital Forensics
  • Security Operations
  • Identity & Access Management
  • SOC Operations
  • Container Security
  • OT/ICS Security
  • API Security
  • Vulnerability Management
  • Incident Response
  • Red Teaming
  • Penetration Testing
  • Endpoint Security
  • DevSecOps
  • Phishing Defense
  • Cryptography
  • Zero Trust Architecture
  • Mobile Security
  • Ransomware Defense
  • Compliance & Governance
  • Deception Technology

其中不少领域的技能数量相当可观。

比如云安全 60 项、威胁狩猎 55 项、威胁情报 50 项、Web 应用安全 42 项、网络安全 40 项、恶意软件分析 39 项、数字取证 37 项、安全运营 36 项、身份与访问管理 35 项。

看到这里,你会有一种很鲜明的感觉:这不是一个“挑几个热点方向做做样子”的项目,而是真想把整个安全世界的骨架搭起来。

它像一栋很大的安全大楼,每个楼层都住着不同专业的人。威胁狩猎的人在对日志皱眉,恶意软件分析的人在拆样本,云安全的人在审 IAM 配置,SOC 的人盯着告警流,取证的人抱着内存镜像和时间线不肯松手。平时大家各忙各的,但当 AI agent 走进来时,这些房间的门都能被敲开。

快速启动很直接,像是在给 AI agent 发工牌

这个项目的上手方式非常干脆。

README 给了两个 Quick Start 方案。

方式一:用 npx 直接添加

1
npx skills add mukul975/Anthropic-Cybersecurity-Skills

方式二:直接克隆仓库

1
2
git clone https://github.com/mukul975/Anthropic-Cybersecurity-Skills.git
cd Anthropic-Cybersecurity-Skills

它还明确说了,这些技能可以直接和 Claude Code、GitHub Copilot、OpenAI Codex CLI、Cursor、Gemini CLI,以及任何兼容 agentskills.io 标准的平台配合使用。

这种感觉很像什么?

像是你给一个 AI agent 换上制服、贴上编号,再把它送进一座装备齐全的训练中心。它不需要你一层一层手动拼工具链,不需要先给它写一堆奇怪的适配逻辑,也不需要你替它把知识压缩成 prompt。项目已经把技能用 agent 能理解的方式摆好了,agent 只要学会读取、挑选、加载和执行。

这是一种非常“AI 原生”的体验。

它不是一股脑把全部知识塞给 AI,而是很聪明地做了分层加载

README 里有一个我很喜欢的设计细节:progressive disclosure architecture

每个技能的 frontmatter 扫描大约只需要 30 个 token,而完整加载一个工作流大约需要 500 到 2,000 个 token。这个机制让 agent 可以先快速浏览全部 754 个技能的概要,再挑出真正相关的少数几个进行深入加载。

这是一个非常懂 AI 现实处境的设计。

因为真正实用的 agent 系统,不能每来一个任务就把整座知识山一口吞下去。那样既贵,也慢,还容易把上下文挤爆。Anthropic-Cybersecurity-Skills 没有蛮干,而是让技能自己学会“先递名片,再出方案”。

README 里的案例特别生动:

用户说:“Analyze this memory dump for signs of credential theft”

然后 agent 的内部流程是:

  1. 扫描 754 个技能的 frontmatter
  2. 根据 tags、description、domain 识别出 12 个相关技能
  3. 选出其中最合适的 3 个加载
  4. 按 Workflow 一步步执行
  5. 用 Verification 部分验证结果
  6. 最终把发现映射到 ATT&CK T1003

这就很像一个训练有素的安全分析师在值班。

听到工单后,他不会一股脑翻遍所有手册,而是先扫一眼目录,迅速定位到内存取证、LSASS 凭证访问、Windows 事件日志这几个相关章节,然后再拿出对应 SOP,一条一条执行,最后再确认发现是否足以支撑结论。

这套机制,让 AI 从“会猜”变成“会办案”。

Skill 的结构设计,像是给每个安全动作都安排了一套标准作业程序

Anthropic-Cybersecurity-Skills 中每个技能,都有统一的目录结构。README 里给出的示例非常清晰:

1
2
3
4
5
6
7
8
9
skills/performing-memory-forensics-with-volatility3/
├── SKILL.md
├── references/
│ ├── standards.md
│ └── workflows.md
├── scripts/
│ └── process.py
└── assets/
└── template.md

这个结构一看就不是临时拼出来的。

  • SKILL.md 是核心定义
  • references/standards.md 放框架映射
  • references/workflows.md 放深入技术流程
  • scripts/ 放可运行的辅助脚本
  • assets/ 放模板、清单和报告材料

这感觉就像每一项技能都不是孤零零的一张纸,而是一整个装备包。
它不是只告诉 agent“该干什么”,还把“参考依据、执行工具、模板材料、验证路径”一起打包好。

你甚至可以把它想象成一个资深分析师在交接班:不仅把任务说明写下来,还把相关标准、脚本、记录模板和检查清单全放桌上,然后说一句,“按这个做,别漏步骤”。

YAML frontmatter 不是冷冰冰的元数据,而是技能的身份证

README 展示了一个真实的 YAML frontmatter 示例,比如 performing-memory-forensics-with-volatility3 这项技能会写清楚:

  • 技能名称
  • 技能描述
  • 所属 domain 和 subdomain
  • tags
  • 对应的 ATLAS technique
  • 对应的 D3FEND technique
  • 对应的 NIST AI RMF 条目
  • 对应的 NIST CSF 条目
  • version
  • author
  • license

这块设计非常关键。

因为对 agent 来说,frontmatter 就像一个技能的身份证、简历和检索卡片。它会告诉 agent:我是谁、我擅长什么、我适合在哪种场景出场、我和哪些框架有关、你大概为什么要加载我。

这种结构化元数据越规范,agent 的选择能力就越强,技能库的可检索性和可编排性就越高。

Anthropic-Cybersecurity-Skills 在这件事上显得特别认真,它不是把 YAML 当“顺手写一下”的附属品,而是把它当成 AI 真正理解技能的入口。

Markdown body 则像技能的作战剧本

除了 frontmatter,每个技能还有统一的 Markdown 主体结构,包括:

  • When to Use
  • Prerequisites
  • Workflow
  • Verification

这四段非常像一个成熟的现场作业卡。

When to Use

像是在告诉 agent:什么时候该叫我上场,什么场景下我最合适,不要没事乱出勤。

Prerequisites

像是在检查背包:工具带了没有、权限够不够、环境准备好了没有、前置条件满足没有。

Workflow

这就是主战区。不是泛泛而谈,而是一步步执行的流程,明确命令、动作和决策点。

Verification

这一步尤其宝贵。很多 AI 系统最大的问题不是“不会做”,而是“做完就以为做对了”。Verification 就像项目里安排的复核官,专门负责问一句:证据够吗?结果能确认吗?结论站得住吗?

这让整个技能体系,从“知识库”升级成了“可验证的行动方案库”。

它的覆盖不是浮在表面,而是真正往下扎到框架和战术层

README 里还专门展开了 MITRE ATT&CK Enterprise 的覆盖情况,并且明确表示覆盖全部 14 个 tactics。

从 Reconnaissance 到 Impact,从 Initial Access 到 Command and Control,再到 Credential Access、Defense Evasion、Lateral Movement、Exfiltration 等等,这套技能库几乎是在朝着完整攻击链的方向铺陈。

更有意思的是,项目还提供了 ATT&CK Navigator layer 文件,用来做覆盖可视化。这说明它并不满足于“我说我覆盖很多”,而是愿意把自己的覆盖面摆上图谱,让大家看得更清楚。

这有点像一个经验老到的安全团队主管,不只是口头说“我们防得挺全”,还把矩阵、板子、图层和覆盖数据全部挂到墙上,给你看清楚哪些地方重兵把守,哪些地方还需要继续补强。

它对 AI/ML 安全也没有回避,而是主动纳入版图

项目不是只盯着传统安全框架,还引入了 MITRE ATLAS 和 NIST AI RMF。这一点尤其值得注意。

因为当下很多“AI + 安全”项目,容易停在一个很浅的层面:要么只是把 AI 当工具,要么只是提一句“我们也关注 AI 风险”。

Anthropic-Cybersecurity-Skills 则明显更进一步。它把 AI/ML 对抗威胁、AI 风险管理这些内容正式纳入技能体系和框架映射中,这意味着它承认一个现实:

今天的安全工作,已经不只是保护传统系统,也包括保护 AI 系统,以及利用 AI 去提升安全工作本身。

这让整个项目显得更像一位跟得上时代的老兵。它既懂传统战场,也知道新战场在哪里。

兼容平台很多,像是给不同 AI agent 发了通用钥匙

README 里列出的兼容平台相当多,涵盖:

AI 代码助手

Claude Code、GitHub Copilot、Cursor、Windsurf、Cline、Aider、Continue、Roo Code、Amazon Q Developer、Tabnine、Sourcegraph Cody、JetBrains AI

CLI agents

OpenAI Codex CLI、Gemini CLI

Autonomous agents

Devin、Replit Agent、SWE-agent、OpenHands

Agent frameworks & SDKs

LangChain、CrewAI、AutoGen、Semantic Kernel、Haystack、Vercel AI SDK,以及任何 MCP 兼容 agent

这意味着它不是在围绕某一个平台做私有生态,而是在努力把自己建设成一个更通用的技能标准内容层。

你可以把它想象成一个精通多国语言的安全学院。无论来的是 Claude 系、Copilot 系、Codex 系,还是各种 framework 出身的 agent,它都能把技能交付给你,而且不要求你先换信仰。

这就是标准化的力量。

它甚至提供了验证工具,说明它不是只想长大,还想长得整齐

项目的 tools/README.md 里提到了 validate-skill.py 这个校验工具,用来在提交 PR 之前验证 SKILL.md 的元数据是否合规。

使用方式也很直接:

校验单个技能

1
python tools/validate-skill.py skills/my-new-skill/

校验全部技能

1
python tools/validate-skill.py --all

它会检查的内容包括:

  • SKILL.md 是否存在
  • YAML frontmatter 是否有效
  • 必填字段是否齐全
  • name 是否符合 kebab-case
  • description 是否足够完整
  • domain 是否为 cybersecurity
  • subdomain 是否在允许列表中
  • tags 是否至少有两个

这类工具的存在,往往最能体现一个项目的成熟度。

因为真正希望社区持续扩张的项目,不能只靠热情撑着。它得有门槛、有规范、有校验,像一个会认真审核入职资料的组织,而不是谁来了都随手塞进通讯录。

Anthropic-Cybersecurity-Skills 在这里的气质就很明显:欢迎贡献,但请按标准来。它像一位要求严格但公平的教官,既愿意招新,也坚持训练质量。

它不是孤零零待在仓库里,而是正在形成外部影响力

README 里还列出了这个项目被多个列表和目录收录,包括:

  • awesome-agent-skills
  • awesome-ai-security
  • awesome-codex-cli
  • SkillsLLM
  • Openflows
  • NeverSight skills_feed

这说明它已经不只是一个“仓库”,而开始成为一个在更大生态里被看见、被引用、被传播的节点。

有些项目像小店,东西不错,但只在街角有人知道;有些项目像码头,一旦建立起来,就会开始接入更多航线。Anthropic-Cybersecurity-Skills 显然更像后者。

它很诚实地说自己是社区项目

README 里专门强调:这是一个独立的、社区创建的项目,不隶属于 Anthropic PBC

这一点很重要,也很值得尊重。

因为当一个项目名字里带着知名技术品牌,很容易让人误会官方背景。而它主动把边界说清楚,其实是在守住一种很健康的开源态度:内容可以雄心勃勃,身份必须诚实透明。

这也让人更容易把注意力集中在项目真正的价值上——不是品牌光环,而是它确实把一套高质量、结构化、可供 AI agent 使用的网络安全技能体系做出来了。

它还有一股很浓的“训练营”气质

如果一定要用拟人化的方式来形容这个项目,我会说它像一所纪律严明、灯火通明的网络安全学院。

白天,威胁情报教官在讲 actor profiling 和 feed integration;
晚上,内存取证教官把 Volatility3 摆在实验台上;
隔壁教室里,SOC 值班官正在教告警分流和升级流程;
楼上的红队教官在讲 AD 攻击和钓鱼模拟;
地下实验室里,恶意软件分析师戴着手套,拆解一份新样本;
而走廊尽头,一位沉默寡言的合规老师,正把 NIST CSF、AI RMF 和 D3FEND 一条条钉到墙上。

AI agent 走进这所学院的时候,可能还有点像一个理论很强但实战偏弱的新兵。可当它从这里出来,它身上会多一种气质:不再只是会聊天,而是开始像一个懂流程、懂判断、懂验证的安全从业者。

为什么这个项目值得被认真看待

因为它抓住了一个特别关键的问题:

AI agent 想进入安全领域,真正缺的不是模型参数,而是结构化、可执行、可验证的专业技能。

安全不是那种“知道概念就能干活”的领域。这里每一步都讲究触发条件、环境准备、工具选型、执行顺序、证据链条和结果验证。任何一步松了,结论就可能站不住。

Anthropic-Cybersecurity-Skills 正是在用一种非常工程化、也非常 AI 原生的方式,把这些本来依赖资深分析师脑内经验的东西,慢慢搬运到标准化技能库里。

它没有把安全工作浪漫化,也没有把 AI 神化。它只是很踏实地做了一件事:把经验拆开、命名、映射、封装、验证,然后交给 agent。

这份踏实,恰恰是最值钱的地方。

结尾

Anthropic-Cybersecurity-Skills 不是那种看完会让你觉得“概念很新”的项目,它更像那种看完以后会让你说一句:

“这东西要是继续长下去,真的会改变 AI agent 在安全领域的工作方式。”

它把 754 项技能、26 个安全领域、5 套框架映射、agentskills.io 标准和多平台兼容性缝合成了一套很像样的体系。它不只是让 AI agent 更懂网络安全,而是在努力让 AI agent 具备一种接近资深分析师的工作节奏:先判断、再准备、后执行、再验证,最终还能放回框架里理解。

这很像是给 AI 安全世界修了一座训练基地。

过去,很多 agent 站在安全现场门口,只能隔着玻璃看专业人员忙碌;现在,这个项目把门推开了,递给它一套标准制服、一叠行动手册和一枚写着“可以上岗”的胸牌。

从此以后,AI agent 不只是会说“这里可能有风险”。

它开始学会说:

“我知道下一步该做什么,也知道怎样证明我做对了。”