Agentic AI方法论

如果给 AI 办一所大学

发布于 2026 年 6 月 17 日

给 AI 办一所大学，这个说法本身就透着一股荒诞。

人类需要大学，说到底是因为知识的传播没法加速。你学会了微积分，你的同事不会因此也会微积分。每个人都要自己从头学。教育是人类社会里为数不多没办法靠复制来绕过的效率瓶颈。

AI 不一样。一个模型训练完成，它的能力可以被无穷复制。不需要让每一个 AI 实例都重新学 Python、重新刷统计学。训练一次，之后复制多少份都行。训练一个前沿模型的成本按亿算，但把它的能力复制给千万用户，新增的开销几乎为零。

从知识传播的角度看，教育 AI 这件事，技术上已经被解决了。那还谈什么给 AI 办大学？

智能可以复制，环境知识不能

模型掌握了通用知识，不等于它在一个具体的工作环境里知道该怎么做事。

一个 agent 会写代码，但它不知道在这家公司的代码库里什么叫写对了。它知道怎么调 API，但不知道这个团队的 API 文档和实际行为之间差了多少。它能生成分析报告，但不知道这个团队看报告的习惯是什么、关心哪几项指标、跳过什么部分。

这些东西不来自预训练，也不能靠分发模型来传递。它们是特定环境的运行知识，只有在这个环境里实际动手做事才能获得。这就是教育 AI 这个问题的第一个切入口：智能可以复制，但对具体工作环境的适配能力，复制不了。

那把环境知识写成文件，然后分发给所有需要的 agent，行不行？

老鸭汤：一套运行了半年的 AI 规则系统

行。我自己就有一套这样的系统，我和朋友们戏称它叫老鸭汤。

老鸭汤做的事不复杂：把工作规范、判断标准、犯过的错写进文件，agent 进来读完就知道这里的规矩，不用每次从零交代。核心思路是把 prompt 里反复出现的背景内容剥离出来，沉淀成持久化文件。agent 进门读一遍，该知道的就都知道了。

我在博客里写过完整的设计思路，也把参考实现开源在了 GitHub上。大半年用下来，效果一直很好。

但半年前做了一次全面审计之后，我发现了一个事先完全没预料到的问题。

分发出去的知识会退化

老鸭汤里积攒了一批祖传规则：没有人记得为什么存在的规则。

最典型的案例：有一条规则要求调用 Claude Code 时额外加一个特定参数。这条规则的来源是 2026 年初的一个 bug：Claude Code 的自适应思考机制有缺陷，特定情况下会把推理资源分配到零。我当时排查过这个问题，确认了 workaround 有效，把规则写进了文档。规则末尾还自己补了一句「如果上游修复了就回退」。

审计时我发现，这个 bug 几个月前就被修复了。规则还在。每一个新接手的 agent 读到这条规则，原样照做。没有任何一个知道为什么要这样做。也没有人定过什么时候该检查。

这件事的根因比单条规则过时更麻烦。经验变成文件的那一刻，发生了一次有损压缩。agent 在环境里碰壁、排查原因、找到规避方法，这个过程包含的信息量远超过一行指令：特定的系统版本、特定的错误模式、如果不这样做会有什么后果。这些是规则的发现上下文。但写成文件的时候，你保留得了的东西只有结论：加这个参数。几百行报错日志、版本号、排查推理过程，最后压成一行。

新 agent 读到这行指令，手中是一个没有前因的结论。它不知道这条规则保护什么，不知道前提条件是什么，不知道什么情况下可以不再遵守。它只能遵守。一个丢失了因果链的行为规则被当成不可质疑的指令来执行，这就是迷信的生成机制。

同一次审计还翻出了更多问题：规则索引里有重复条目，有断链指向已经改名的项目，公理系统的统计数字和实际数量对不上。每一个问题的源头都是同一个：系统只有 add 操作，没有 retire 操作。规则只能往里加，加进去就没人动它了。

人类组织管这个叫陈规陋习。AI 系统里出现了完全一样的东西，只是积累速度快了十倍。

规则文件更像教科书

我一直把老鸭汤当成 agent 的记忆。但记忆这个东西，绑在经历上。你记得为什么要加那个参数，是因为你亲历了那次故障，翻过那个 issue，验证过那个 workaround。记忆靠产生它的经历来保鲜。

文件做不到。文件和主体是分离的。它只记了结论，不携带经历。它不会自己更新，不会在前提消失时自动标记为过时。老鸭汤里那条已经作废的规则，就像一本十年前的教科书还在教你用软盘保存文件。教科书需要定期出修订版。

你坐在这里猜不出哪一页过时了，就像我坐在屏幕前猜不到那个 bug 已经被修复了。修订的唯一有效信号，来自学生回到实践中去碰壁。

裸跑：让环境来裁判

机制是这样的：定期派一个不携带任何旧规则的 agent 进入当前环境，执行真实任务。它拥有预训练的全部能力，但没有老鸭汤里积累的任何一个 workaround。

如果它顺利完成了任务，说明那些旧规则已经失效了。环境自己修复了，或者规则的前提条件已经消失。团队可以放心删掉它们。

如果它碰壁了，犯了和老鸭汤里记录的一模一样的错，说明规则还在保护系统。但这次碰壁多做了一件事：它在当下用当下的环境重新生成了一份新鲜的发现上下文。这份新的经历可以替换掉旧文件里那行干瘪的结论，让规则重新获得为什么要这样做的因果链。

三件事在这个动作里合为一体。考试，是 agent 在环境里的实际表现。教科书修订，是根据考试结果删掉死规则、刷新活规则。教育，是整个过程的净效果：老鸭汤变得新鲜，agent 对当前环境变得有用。学生的每一次碰壁，都是教科书再版的信号。

AI 大学做的事是年审

所以如果给 AI 办一所大学，它教的东西和人类的大学完全不同。预训练已经把全部通用知识给了 AI，这部分可以无限复制。这所大学的主要功能是反退化：定期把 agent 推回环境里裸跑，检验它继承的规则里哪些还活着、哪些已经退变成了祖传规则。活着的规则通过回归测试重新注入发现上下文，死掉的规则被清理出去。

它更像年审。你不需要每年重新考驾照，但车需要每年开回检测站，查一遍哪些零件还能用、哪些该换了。老鸭汤也需要这样的年审。否则它会在不知不觉中变成一本发霉的旧教科书，里头的每一条规则看上去都有道理，但没有人知道它们指向的到底还是不是当下的世界。

我这次手动清理了审计发现的几个最显眼的案例。但手动清理本身也只是一种临时手段。真正的解法是把年审变成自动化流程：定期跑一轮裸 agent 回归测试，让环境的真实反馈来决定哪些规则留、哪些规则走。到那一步，AI 大学就不仅是一个比喻了。它是一套可以工程化的制度，让规则系统在持续运行中靠环境的真实反馈来维持。

给 AI 办大学，最终交付的是一条对抗知识老化的年审流水线。它通过持续的检验和清理，让规则系统始终保持和真实世界的连接。