AI技能(Skill)和知识库瘦身:你喂给模型的每行废话,都在烧钱

📂 技术笔记 📝 707 字 ⏱️ 2 min

起因

这周我把公司 AI 组整理的项目知识库接进了 Claude Code 的开发流程,结果简直了 🤦‍♂️

模型的 Token 费用直接往上飙,迭代开发一个小需求花了将近 2 个小时。而之前同样复杂度的需求,顶多 30 分钟内搞定了。

怀揣着纳闷查了下原因——发现是因为知识库里某个 800 多行的 md 文件 导致的。

是的,就一个文件。

问题在哪

很多人觉得「知识库越大越好」「技能越全越牛」,恨不得把团队 wiki、API 文档、历史决策记录一股脑全塞给 AI。

但你有没有想过——大模型上下文窗口是固定的

你把一个 800 行的文件喂进去,模型得「读完」它才能理解你的需求。这期间:

  1. Token 消耗量暴涨(钱啊)
  2. 模型注意力被稀释(质量降了)
  3. 响应速度变慢(时间长了)

你以为是「喂得越饱,干活越好」——实际上是「喝水撑死」。

三个规则

我踩完坑之后,给自己定了三条铁律:

1. 每个 md 文件不超过 200 行

超过 200 行,说明这个文件的粒度有问题。拆。不要犹豫。

2. 用 readme 建立索引,别把所有细节堆进去

readme 就是地图,告诉模型「什么信息在哪个文件里」。模型需要的是导航能力,不是全文背诵。

3. 模块粒度要清晰、明确、简单

一个模块做一件事。如果这个文件既讲 API 又讲部署又讲历史背景——拆成三个文件。

最终解法

文件拆完之后,整个知识库还是有点大。怎么办?

向量化

把整个知识库通过向量化模型转成向量数据,存到本地的向量数据库里。写一个脚本和 Skill,让模型在需要的时候主动检索,而不是被动接收全部内容。

效果:

  • 上下文干净了
  • Token 省了
  • 响应变快了
  • 关键是——精度反而提高了

因为模型拿到的是精确匹配的相关信息,不是一堆噪音里的模糊答案。

小结

给你的 AI 知识库和 Skill 做一次瘦身吧。检查一下:

  • 有没有超过 200 行的文件?
  • 能不能用 readme 做索引?
  • 颗粒度够不够清晰?

你的模型会感谢你——你的钱包也是 😊