AI 的「技能」到底是什么?为什么有了它,AI 能干以前干不了的事
你大概率用过 ChatGPT 或者类似的大模型。你问它「帮我写个 Python 脚本爬取网页」,它能写。你问「量子计算是怎么回事」,它能讲。这些是模型训练时就学会的东西——互联网上的海量文本里,Python 代码和科普文章遍地都是。
但你让它「帮我把这篇博客发到我 Halo 网站上,封面用百度搜的第一张图,顺便用 QQ 通知我一声」——它做不了。不是它笨,是它缺了点什么。
缺的就是「技能」。
大模型的天然短板
大语言模型有一个根本性的局限:它的知识截止在训练数据的时间点。它不知道你的博客后台 API 长什么样,不知道你的 QQ 机器人用什么协议,不知道你装了什么软件、文件放在哪。
更关键的是,模型训练时学到的是「陈述性知识」——Python 的语法、HTTP 协议的原理。但它缺「操作性知识」——「在这个具体的系统里,要发博客应该调哪个 API、token 怎么传、WAF 拦截了该怎么办」。
一个模型可以解释 RESTful API 的设计哲学,但它不知道你的 Halo 实例上传附件时会被 1Panel 的 WAF 拦截,必须绕过 multipart 请求。这不是通用知识,这是特定环境的特定经验。
Skills 解决的,就是这个问题
Skills 的核心思路不复杂:把特定领域的操作知识写成文档,在需要的时候注入到 AI 的对话上下文中。
就像一个经验丰富的同事坐在你旁边,手里拿着一本笔记——笔记里记着「这个系统有个坑,得这么绕」「那个接口的参数顺序跟文档不一样」。AI 仍然是同一个 AI,但看了笔记之后,它就知道该怎么做了。
几个关键设计让它比简单的「写个 prompt」强得多:
按需加载。 不是把所有技能一股脑塞给 AI。用户说「发博客」,才加载博客发布技能。用户说「下载 B 站视频」,才加载 B 站下载技能。上下文窗口是有限的,塞太多东西反而会让 AI 迷失。
结构化文档。 Skills 不是随便写的几行提示词。它有标准格式——触发条件、步骤清单、常见坑点、验证方法。每一步有可执行的命令,不是模糊的建议。
可累积。 这是最妙的部分。你踩了一个坑,解决了,然后把这个经验写进 Skill。下次 AI 再执行类似任务,就不会再掉进同一个坑。不只你受益——用同一个 Skill 的所有人都受益。
跨模型复用。 Skills 不绑定任何特定模型。换了底层 LLM,从 GPT 切到 Claude 再切到 DeepSeek,Skills 照用。因为它是上下文注入,不是模型微调。
为什么 Skills 能让 AI 做「以前做不了的事」
大模型本身是个通才——什么都会一点,什么都不精。Skills 把它变成了专才。
没有博客发布 Skill 时,AI 知道什么是 Markdown、什么是 HTTP POST,但它不知道你的博客 URL 是 blog.pmhs.top、token 存在哪个文件、传封面要先关 WAF。有了 Skill,这些全是写死的操作流程,AI 照做就行。
没有抖音下载 Skill 时,AI 可能会建议你用 yt-dlp——然后你发现 yt-dlp 在抖音上根本跑不通。Skill 里记着:「别用 yt-dlp,它搞不定抖音。要用移动端 API 拿 CDN 直链」,还附带了 cookie 提取的步骤。
这就是 Skills 的威力:它把「踩过的坑」变成了「绕坑的地图」。
跟其他方案比
有人问,这不就是 RAG(检索增强生成)吗?
有点像,但不是一回事。RAG 是把大量文档向量化存进数据库,查询时检索相关片段。Skills 是精心编写的手册——它不靠语义检索碰运气,而是精确匹配任务。查向量库可能返回「相关的 3 个文档片段」,Skills 是「就是这本手册,从头看到尾」。
有人问,这不就是 Function Calling?
也不是。Function Calling 是「AI 决定调哪个函数,函数执行后返回结果」。Skills 是「在 AI 做决策之前,先给它看一份操作指南,改变它的思考方式」。Function Calling 给的是工具,Skills 给的是经验。
也有人拿它跟 Fine-tuning 比。Fine-tuning 是改变模型本身的参数,成本高、周期长、不可逆。Skills 是外挂知识,更新一个 Markdown 文件就生效,错了删掉就行。
一个真实例子
假设你要从抖音批量下载自己喜欢的视频。
没有 Skill:AI 大概率推荐 yt-dlp,然后你折腾半天发现不行。它可能让你去装 Selenium 模拟浏览器——又慢又不稳定。
有 Skill:AI 直接告诉你「去浏览器 F12 拿 cookie」,然后精确调用抖音的 /aweme/v1/web/aweme/favorite/ 接口,拿到视频直链,curl 下载。全程不超过三分钟。
区别不在于 AI 聪明了多少——模型没变。区别在于,有人已经把这条路走了一遍,把地图画好了。
Skills 的本质
如果把 AI 比作一个新手工程师,Skills 就是老员工留下来的交接文档。没有文档,新人也能干活——磕磕绊绊、反复试错。有了文档,他知道这个系统有哪些坑、哪些捷径、哪些约定俗成的做法。
Skills 做了一件事:把经验变成可传递的资产。
以前,你解决了一个复杂问题,经验留在你脑子里。最多写篇博客,但博客不会被 AI 在合适的时机自动加载。Skills 把这个闭环打通了——经验 → 文档 → AI 自动在需要时读取 → 下次不再犯同样的错。
这不是 AI 变聪明了。是人类把经验结构化地喂给了 AI。
最后
Skills 没有新的神经网络架构,没有更长的上下文窗口,没有更强的推理能力。
它只是做了一件朴素的事:把人类踩过的坑,写成 AI 能看懂的文档,在合适的时候塞给它。
这件小事,才是 AI 从「会聊天」走到「能干活的」之间,真正的差距。