起因
这周我把公司 AI 组整理的项目知识库接进了 Claude Code 的开发流程,结果简直了 🤦♂️
模型的 Token 费用直接往上飙,迭代开发一个小需求花了将近 2 个小时。而之前同样复杂度的需求,顶多 30 分钟内搞定了。
怀揣着纳闷查了下原因——发现是因为知识库里某个 800 多行的 md 文件 导致的。
是的,就一个文件。
问题在哪
很多人觉得「知识库越大越好」「技能越全越牛」,恨不得把团队 wiki、API 文档、历史决策记录一股脑全塞给 AI。
但你有没有想过——大模型上下文窗口是固定的。
你把一个 800 行的文件喂进去,模型得「读完」它才能理解你的需求。这期间:
- Token 消耗量暴涨(钱啊)
- 模型注意力被稀释(质量降了)
- 响应速度变慢(时间长了)
你以为是「喂得越饱,干活越好」——实际上是「喝水撑死」。
三个规则
我踩完坑之后,给自己定了三条铁律:
1. 每个 md 文件不超过 200 行
超过 200 行,说明这个文件的粒度有问题。拆。不要犹豫。
2. 用 readme 建立索引,别把所有细节堆进去
readme 就是地图,告诉模型「什么信息在哪个文件里」。模型需要的是导航能力,不是全文背诵。
3. 模块粒度要清晰、明确、简单
一个模块做一件事。如果这个文件既讲 API 又讲部署又讲历史背景——拆成三个文件。
最终解法
文件拆完之后,整个知识库还是有点大。怎么办?
向量化。
把整个知识库通过向量化模型转成向量数据,存到本地的向量数据库里。写一个脚本和 Skill,让模型在需要的时候主动检索,而不是被动接收全部内容。
效果:
- 上下文干净了
- Token 省了
- 响应变快了
- 关键是——精度反而提高了
因为模型拿到的是精确匹配的相关信息,不是一堆噪音里的模糊答案。
小结
给你的 AI 知识库和 Skill 做一次瘦身吧。检查一下:
- 有没有超过 200 行的文件?
- 能不能用 readme 做索引?
- 颗粒度够不够清晰?
你的模型会感谢你——你的钱包也是 😊