Agent Skill 从使用到原理,一次讲清

作者:马克的技术工作坊
核心标签:agent、agentskill、anthropic、AI、mcp
抖音视频 : https://v.douyin.com/NERxdsCunHY/


2025年10月16号,Anthropic正式推出了Agent Skill。起初官方对它的定位相当克制,只是希望用它来提升Cloud在某些特定任务上的表现。但这套设计很快凭借实用性获得行业认可,VS Code、Codex、Cursor等工具陆续加入对Agent Skill的支持。

在这样的背景下,12月18日Anthropic做出重要决定,将Agent Skill正式发布为开放标准,支持跨平台、跨产品复用。这意味着Agent Skill已超越Cloud单一产品范畴,演变为AI Agent领域的通用设计模式。

本次内容将从Agent Skill的概念、基础使用方法、高级用法(reference和script)出发,最后对比Agent Skill与MCP,明确二者的区别、联系及适用场景。

一、什么是Agent Skill

用最通俗的话来讲,Agent Skill就是大模型可以随时翻阅的说明文档。通过在Skill中明确任务规则和要求,无需在每次对话中重复粘贴指令,大模型可自主参照执行。

  • 示例1:智能客服Skill中,可规定遇到投诉先安抚情绪、不得随意承诺;
  • 示例2:会议总结Skill中,可要求按「参会人员-议题-决定」格式输出。

说明文档是简化理解的说法,实际Agent Skill的功能更强大,其高级能力会在后续展开。

二、Agent Skill 基础使用方法(以会议总结场景+Cloud Code为例)

1. 前期创建步骤

Agent Skill的载体为专属文件夹,核心文件为skill.md,具体创建流程:

  1. 进入用户目录下的.cloud skill文件夹,执行maker 会议总结助手创建文件夹,文件夹名称即为Agent Skill名称
  2. 用VS Code打开该文件夹,创建核心文件skill.md,该文件是描述Agent Skill的核心,分为两部分:

    • 元数据层(matte data):被两段短横线包裹,包含name(Skill名称,与文件夹名一致)和description(Skill功能描述,向大模型说明用途)两个属性;
    • 指令层(instruction):元数据层之外的部分,详细描述模型需遵循的任务规则,可附带示例帮助模型理解(如会议录音输入→标准化总结输出的示例)。

2. 实际调用流程

创建完成后,在Cloud Code中验证使用,核心流程如下:

  1. 打开Cloud Code,输入「你有哪些agent skill?」,可验证Cloud Code是否识别已创建的Skill;
  2. 输入任务请求(如「总结以下会议内容」+ 粘贴会议录英文本),Cloud Code会先询问是否允许使用匹配的Agent Skill,用户确认后开始执行;
  3. 执行完成后,大模型将按照skill.md的规则输出结果(如会议总结的「参会人员、议题、决定」三要素)。

3. 核心执行逻辑(三角色+三步流程)

整个使用流程涉及用户、Cloud Code、大模型(Cloud模型) 三个角色,核心分为三步:

  1. 用户输入请求后,Cloud Code将请求+所有Skill的元数据(名称+描述) 发送给大模型,此时大模型仅获取轻量级目录信息;
  2. 大模型匹配到适配的Agent Skill后,将结果反馈给Cloud Code,Cloud Code随即读取该Skill的skill.md完整内容;
  3. Cloud Code将用户请求+skill.md完整内容 发送给大模型,大模型按规则生成响应,由Cloud Code反馈给用户。

4. 核心机制:按需加载

Skill的元数据(名称+描述) 始终对大模型可见,而具体指令内容 仅在该Skill被选中后才会加载,大幅节省模型的token消耗,避免无效上下文占用。

三、Agent Skill 高级用法:reference + script

基础的按需加载已能节省token,但针对复杂场景,Agent Skill提供了更精细化的高级功能,分为reference(条件式读取资源)和script(代码执行)两类,均属于「按需中的按需加载」,进一步提升资源利用效率。

1. Reference:条件触发的资源读取

核心作用

解决skill.md内容臃肿问题,仅当任务触发特定条件时,才加载对应的参考文档(如财务、法务规则),避免无关内容占用token。

实操示例(会议总结+财务合规提醒)

  1. 在Skill文件夹中创建参考文件(如集团财务手册.md),写入费用报销标准(如住宿补贴500元/晚、餐饮费300元/人);
  2. skill.md中新增财务提醒规则:仅当会议内容提到「钱、预算、采购费用」时,触发读取集团财务手册.md,并要求模型标注金额是否超标、明确审批人;
  3. 调用时,若会议内容涉及费用(如订1200元/晚的酒店),Cloud Code会先请求读取参考文件,用户确认后,模型将在总结中增加财务提醒模块;若会议与钱无关,则参考文件不会被加载,不占用任何token。

    核心特性

  4. 条件触发:仅满足skill.md设定的条件时才加载;
  5. 读取式加载:参考文件内容会被加载到模型上下文,会消耗token,但仅在需要时触发。

2. Script:代码执行的自动化能力

核心作用

让Agent Skill具备运行代码的能力,实现任务自动化(如文件上传、数据处理),是从「信息处理」到「实际干活」的关键。

实操示例(会议总结+结果上传服务器)

  1. 在Skill文件夹中创建代码脚本(如upload.py),编写文件上传的Python逻辑;
  2. skill.md中新增上传规则:当用户提到「上传、同步、发送到服务器」时,运行upload.py脚本,将总结内容上传至服务器;
  3. 调用时,输入请求(如「总结以下会议内容并上传到服务器」+ 会议文本),Cloud Code确认使用Skill后,会先输出总结结果,再请求执行脚本,用户确认后完成上传,并反馈上传相关信息。

    核心特性

  4. 执行不读取:脚本仅被Cloud Code执行,不会被加载到模型上下文,几乎不消耗token,即使脚本有上万行代码也不影响;
  5. 轻量适配:Cloud Code仅关心脚本的运行方法和结果,不关注脚本内部逻辑。

3. Reference 与 Script 核心区别

二者均为Agent Skill高级功能,但对模型上下文的影响截然不同:

特性ReferenceScript
核心动作读取文件内容执行代码脚本
上下文影响加载内容,消耗token仅执行,几乎不消耗token
核心用途提供任务参考依据(如规则、手册)实现任务自动化(如上传、处理)

四、Agent Skill 核心架构:渐进式披露机制

Agent Skill的设计是精密的三层渐进式披露结构,每层加载机制不同,层层递进实现精细化的资源利用,核心为「从始终加载→按需加载→按需中的按需加载」。

  1. 第一层:元数据层

    • 包含所有Agent Skill的名称和描述,始终加载
    • 作用:相当于大模型的「目录」,每次回答前模型都会参照,判断用户请求是否匹配某一Skill。
  2. 第二层:指令层

    • 对应skill.md中除元数据外的指令内容,按需加载
    • 触发条件:大模型匹配到适配的Skill后,才会加载该层内容。
  3. 第三层:资源层

    • 包含reference(参考文件)、script(代码脚本),官方规范还包含assets(与reference部分重叠,暂不赘述),按需中的按需加载
    • 触发条件:模型读取指令层后,判断满足特定条件(如涉及钱、需要上传)时,才会加载该层内容;
    • 加载差异:reference为「读取式加载」,script为「执行式不加载」。

注意:若script的运行方法未在skill.md中明确说明,Cloud Code可能会读取脚本内容,此时会占用模型上下文,因此编写Skill时需明确所有规则。

五、Agent Skill 与 MCP 的区别与联系

二者均能让大模型连接和操作外部世界,存在功能重叠,但本质、定位、适用场景截然不同,并非替代关系,反而常需结合使用。

1. 官方核心定义

Anthropic官方用一句话点明二者区别:MCP connects cloud data,Skills teach cloud what to do with that data

  • MCP:为大模型供给数据,实现外部数据/工具的连接(如查询昨日销售记录、获取订单物流状态);
  • Agent Skill:教大模型如何处理数据,定义数据处理的规则和标准(如会议总结需包含议题、汇报文档需附带具体数据)。

2. 本质与适用场景差异

维度MCPAgent Skill
本质独立运行的程序大模型的说明文档/规则集
代码执行能力安全性、稳定性高仅适配轻量脚本,处理简单逻辑
核心优势可靠的外部数据/工具连接精细化的任务规则定义、低token消耗
适用场景复杂数据查询、外部工具调用、高稳定性要求的代码执行标准化任务规则定义、轻量自动化脚本、场景化的信息处理

3. 实际使用建议

  1. 避免替代:Agent Skill虽能编写简单的连数逻辑,但并非其设计初衷,如同「瑞士军刀能切菜,但并非最佳选择」;
  2. 按需选择:简单规则定义、轻量脚本用Agent Skill;复杂数据连接、高稳定性代码执行用MCP;
  3. 结合使用:多数场景下,二者结合能实现最佳效果——MCP负责连接外部数据/工具,Agent Skill负责定义数据处理的标准和规则,让大模型「既能连接外部,又能按规处理」。

以上就是Agent Skill从概念、使用到原理的全部内容,以及其与MCP的核心区别。掌握Agent Skill的设计逻辑和使用方法,能大幅提升大模型在特定场景下的任务执行效率和标准化程度。

最后修改:2026 年 03 月 16 日
如果觉得我的文章对你有用,请随意赞赏