AI Agent 的 Skills 系统:从提示词工程到自我进化

AI Agent 的 Skills 系统:从提示词工程到自我进化

Seven

大语言模型的能力很强,但有一个致命缺陷——每次对话都从零开始。你花了一小时教会它你的代码风格、部署流程、踩坑记录,下次再开新会话,这些知识全部消失。

Skills 系统的出现,就是为了解决这个问题:让 AI Agent 拥有可复用的程序性知识,实现从”每次重新学习”到”持续积累经验”的转变。

AI Agent Skills 系统

一、从记忆说起:Agent 为什么需要 Skills?

在讨论 Skills 之前,先理解 AI Agent 的记忆分类:

记忆类型 存储内容 生命周期 类比人类
工作记忆 当前对话上下文 单次会话 工作台上摊开的资料
事实记忆 用户偏好、环境信息 持久化 笔记本上的备忘
程序记忆 “怎么做某件事”的流程 持久化 你的肌肉记忆和经验

传统的 AI Agent 只有前两种记忆。你告诉它”我的项目用 Python 3.11”,它记住了事实;但你花了一小时教它怎么配置 CI/CD,下次它又得从头摸索。

Skills 解决的就是第三种:程序记忆(procedural memory)。

二、Skills 的发展历程

早期:提示词模板时代

最朴素的做法是把经验写成提示词模板,每次对话前手动贴给模型:

1
2
3
4
5
6
你是一个 DevOps 工程师。部署流程:
1. 检查 kubectl 配置
2. 编写 deployment.yaml
3. kubectl apply
4. 验证 pod 状态
...

这个方案的问题很明显:

  • 模板需要人工维护,容易过时
  • 长度有限,复杂流程写不下
  • 不同任务需要不同模板,维护成本指数增长

中期:RAG 增强时代

向量数据库(Pinecone、ChromaDB 等)出现后,很多人把文档片段存进向量库,按相似度检索注入上下文。这解决了长度问题,但带来了新问题:

  • 存的是事实性知识(”K8s 是什么”),不是过程性知识(”怎么部署 K8s”)
  • 检索结果片段化,缺乏完整流程
  • 向量数据库需要额外运维,增加系统复杂度

现代:结构化 Skill 文档时代

Skills 系统的思路完全不同——把经验写成结构化的 Markdown 文档,按需加载到上下文中

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
---
name: deploy-k8s
description: "Use when deploying applications to Kubernetes clusters."
---

# K8s 部署流程

## When to Use
- 需要部署新服务到 K8s 集群
- 更新现有部署的镜像版本

## Procedure
1. 检查 kubectl 配置
2. 确认 namespace
3. 编写 deployment.yaml
4. kubectl apply
5. 验证状态

## Pitfalls
- kubectl 未配置时先跑 config
- namespace 不存在时先创建

核心思路是:Skill 是文件系统原生的纯文本文档,不是数据库条目。 这带来了几个关键优势:

  1. 可读性:人类和 AI 都能直接阅读
  2. 可版本控制:用 Git 跟踪变更
  3. 可共享:复制粘贴就能分享给同事
  4. 零依赖:不需要数据库、向量引擎、额外服务

三、Skills 的核心原理

3.1 结构化知识文档

一个 Skill 通常由以下部分组成:

部分 作用 是否必须
Front-matter 元数据:名称、描述、标签 ✅ 必须
When to Use 触发条件:什么场景下加载这个 Skill ✅ 必须
Procedure 具体操作步骤 推荐
Pitfalls 踩坑记录和解决方案 推荐
Verification 如何验证操作成功 可选

Front-matter 用 YAML 格式,定义了 Skill 的元数据:

1
2
3
4
5
6
7
---
name: my-skill
description: "Use when <触发条件>."
version: 1.0.0
author: Qi
tags: [devops, kubernetes]
---

3.2 按需加载机制

Skills 不是每次都全量加载的,而是根据任务上下文按需选择

当你说”帮我部署这个服务到 K8s”,Agent 会:

  1. 扫描所有已安装的 Skills
  2. 根据 When to Use 匹配相关 Skills
  3. 将匹配到的 Skills 注入当前会话的上下文
  4. 按 Skill 的 Procedure 步骤执行任务

这就像你遇到一个问题时,不是翻遍所有笔记本,而是直接找到相关的那一页。

3.3 自动沉淀机制(核心亮点)

这是现代 Skills 系统最独特的地方——Agent 在完成任务后,可以自动将流程沉淀为新的 Skill

具体流程:

  1. 用户下达一个复杂任务(如”帮我搭建 CI/CD”)
  2. Agent 通过工具调用完成任务(期间可能踩坑、修复、重试)
  3. 任务成功后,Agent 分析整个执行过程
  4. 提取关键步骤、有效命令、踩坑记录
  5. 生成一个新的 SKILL.md 文档
  6. 保存到 Skills 目录,供未来复用

这就是”自我进化”的含义——Agent 在执行中学习,在学习后提升。

评测数据显示,自动生成的 Skill 在重复任务中可以将执行速度提升约 40%,且全程无需人工调整提示词。

3.4 条件激活与 Fallback

现代 Skills 系统还支持条件激活:

1
2
3
4
metadata:
hermes:
fallback_for_toolsets: [web] # 当 web 工具不可用时才显示
requires_toolsets: [terminal] # 必须有 terminal 工具才显示

这意味着:

  • 如果你有付费的搜索 API,Agent 用原生工具
  • 如果没有 API,自动激活一个免费的搜索 Skill 作为 fallback

四、Skills 的实际效果

4.1 速度提升

最直接的效果是速度。第一次执行任务时,Agent 需要从零摸索,可能需要 10 次工具调用;有了 Skill 后,直接按流程走,5 次就够了。

4.2 质量一致性

没有 Skill 时,Agent 每次执行同一类任务的方式可能不同——有时用方法 A,有时用方法 B,质量波动大。有了 Skill,每次都是同一个经过验证的流程,输出质量更稳定。

4.3 知识沉淀

这是最被低估的效果。很多团队的”最佳实践”只存在于老员工的脑子里,新人来了要重新踩坑。Skills 把这些隐性知识显性化——写成文档后,无论是人还是 AI 都能直接复用。

4.4 跨会话连续性

传统 AI Agent 的知识边界是单次会话。Skills 打破了这个限制——上一次会话中积累的经验,可以通过 Skill 传递给下一次会话,甚至传递给其他用户。

五、如何使用 Skills

5.1 创建 Skills

最简单的方式是手动编写 SKILL.md 文件,保存到 Skills 目录:

1
2
3
4
5
6
7
~/.hermes/skills/
├── devops/
│ └── deploy-k8s/
│ └── SKILL.md
├── blog/
│ └── blog-workflow/
│ └── SKILL.md

更高效的方式是让 Agent 自动生成。当你完成一个复杂任务后,告诉 Agent:”把刚才的流程保存为 Skill”,它会自动提取关键步骤并生成文档。

5.2 管理 Skills

随着时间推移,Skills 会积累。需要定期维护:

  • 删除无用的:长期不用的 Skill 可能已过时
  • 更新过时的:技术栈变化后,及时更新相关 Skill
  • 固定常用的:把高频 Skill 标记为 pinned,避免被自动清理

5.3 共享 Skills

Skills 的纯文本特性使得共享非常简单:

  • 团队内部:放在共享目录,所有成员的 Agent 都能使用
  • 开源社区:发布到 Skills Hub,其他人可以一键安装
  • 跨工具:理论上,任何支持 Skills 格式的 Agent 都能使用同一份 Skill 文档

六、不同实现对比

目前主流的 AI Agent 工具对 Skills 的支持程度不同:

工具 Skills 支持 自动沉淀 生命周期管理 文件格式
Hermes Agent ✅ 完整 ✅ 自动生成 ✅ Curator 系统 Markdown
Claude Code ⚠️ 部分(AGENTS.md) Markdown
Cursor ⚠️ 部分(.cursorrules) 文本
ChatGPT

Hermes Agent 在这个领域走得最远,它的 Skills 系统包含:

  • 自动沉淀(Agent 完成任务后提议创建 Skill)
  • 生命周期管理(Curator 自动清理过时的 Skill)
  • 条件激活(按工具可用性动态显示/隐藏)
  • 社区共享(Skills Hub 一键安装)

七、实际使用建议

7.1 从高频任务开始

不要一开始就试图把所有工作流都写成 Skill。先找出你最常做的 3-5 个任务,为它们创建 Skill。用了一段时间后,再根据实际使用情况优化。

7.2 保持 Skill 精简

一个 Skill 不应该超过 500 行。如果太长,说明它试图覆盖太多场景——拆分成多个小 Skill,每个专注于一个具体场景。

7.3 记录踩坑

Skill 的价值不只是”怎么做”,更在于”怎么做才不会踩坑”。把你在实践中踩过的坑都写进 Pitfalls 部分,这是 Skill 最有含金量的内容。

7.4 定期 Review

每个季度花半小时 Review 一下你的 Skills 目录。删除不再需要的,更新已过时的,合并重叠的。

八、未来展望

Skills 系统目前还在快速演进中。可以预见的几个方向:

1. 跨工具标准化

目前不同 Agent 的 Skills 格式不兼容。未来可能会出现一个统一的 Skills 格式标准,让一份 Skill 可以在任何 Agent 上运行。

2. 自动优化

Agent 不仅能自动生成 Skill,还能根据执行结果自动优化现有 Skill。比如发现某个步骤总是失败,自动更新为更可靠的方案。

3. 社区生态

随着 Skills Hub 的发展,可能会出现类似 npm 或 PyPI 的 Skills 生态系统。开发者发布自己的 Skills,用户一键安装使用。

4. 多模态 Skills

目前的 Skills 主要是文本形式。未来可能会支持更丰富的格式——包含截图、视频演示、交互式教程等。

九、总结

Skills 系统代表了 AI Agent 从”对话工具”向”持续学习助手”的转变。它的核心价值在于:

  1. 可复用:一次创建,多次使用
  2. 可积累:经验随时间增长
  3. 可共享:团队和社区都能受益
  4. 零依赖:纯文本,Git 友好

对于个人开发者,建议从一个高频任务开始尝试。创建你的第一个 Skill,体验一下”AI 记住了怎么做你的工作”是什么感觉。

参考链接

  • 标题: AI Agent 的 Skills 系统:从提示词工程到自我进化
  • 作者: Seven
  • 创建于 : 2026-06-03 20:00:00
  • 更新于 : 2026-06-04 01:10:58
  • 链接: https://blog.oneiseven.top/2026/06/03/Hermes-Agent-Skills系统详解/
  • 版权声明: 本文章采用 CC BY-NC-SA 4.0 进行许可。
评论