随手拍的郁金香,阳光好拍什么都漂亮!
本周摘要
- 博客小更新:跟着云五老师的脚步 把博客换成 Cloudflare Pages ,免费支持私有仓库。
- 运动:买健身房周卡体验了一周,去了四天,应该会继续练。终于出去骑车,来回十几公里,腿完全不累,手腕一直紧绷有些痛,附近的路况实在太差,有了这次经验于是自信和人约了下下周出去骑车。
- 毛线:本天才只花了半小时就上手了环形针,现在是 crochet 和 knitting 双修啦。没想到真的在快要热起来的季节开始织冷帽,不过刚好又降温了很适合窝着玩毛线。
- 学习:简单了解了一些 agent 相关的知识,包括 rule、workflow、skill,当然还有最近很火的 openclaw,个人感觉还没有特别吸引我的地方。又开始复习 C 语言,有热心好友给我分享了付费网课,但进度缓慢,甚至边玩毛线边听课。最近一周里有六天都在练习听力和阅读,听力似乎已经小有感觉,最好的情况基本都能听到(S1)。
- 娱乐:终于追完《血条》,还看了一部英剧,暂时没找到下一部看的。降温的周天又玩起饥荒。
让 CC 给我总结了一下本周的活动时间。
| Activity | Total time |
|---|---|
| 学习 | 17h 44m |
| 工作 | 13h 55m |
| 毛线 | 7h 43m |
| 观影 | 4h 49m |
| 骑行 | 4h 00m |
| 娱乐 | 3h 50m |
| 运动 | 3h 44m |
| 生活 | 3h 25m |
| 观鸟 | 1h 06m |
| 写作 | 53m |
文娱
为什么需要技能?
在深入探讨技能及其背后的原因之前,让我们先了解一下我们是如何走到这一步的?
谷歌的 Antigravity 和类似的 AI Agent平台不仅仅是执行严格命令的监听器,而且是能够解释意图、规划多步骤工作流程以及以一定程度的自主性执行复杂任务的推理器。
为此,它需要所谓的上下文。上下文需要包含本地文件系统、项目结构,并代表用户执行命令。通过集成 MCP 服务器(提供各种工具)可以扩展这些 Agentic 平台的功能,让 Agent 可以基于用户的私有数据来生成响应,并实际操作外部工具和服务,而不仅仅是生成文本。
这就引出了上下文饱和的问题 。如果将整个代码库、文档库和工具集不加区分地加载到模型的活动内存中会造成显著的延迟和经济开销,这会导致模型混乱,从而产生次优结果。
假如我们给代理加载了一堆工具,GitHub MCP 服务器(50 个工具)、Playwright MCP 服务器(24 个工具)和 Chrome DevTools MCP 服务器(26 个工具)。 问题在于,我们给代理加载了数百个工具,消耗了 4 万到 5 万个 Token,而最终可能只会用到一个工具。
为了解决这个问题,Anthropic 提出了一个新标准: 智能体技能 。根据定义:
Agent Skills 是一种轻量级的开放格式,可通过专业知识和工作流扩展 AI agent的功能。
Skills 代表着从单一上下文加载到渐进式披露的转变。技能不再强制模型在会话开始时“记忆”所有可能的功能,而是允许开发人员将专业知识(例如数据库迁移协议、安全审计工作流程或特定代码审查标准)打包成模块化的、可发现的单元(技能)。
模型仅向用户展示这些功能的轻量级“菜单”(元数据),并且仅在用户意图与特定技能匹配时才加载复杂的程序知识(指令和脚本)。这避免了工具臃肿,将上下文信息保持在最低限度,并且也具有良好的经济效益。