Agentic AI方法论

如果给 AI 办一所大学

给 AI 办一所大学,这个说法本身就透着一股荒诞。

人类需要大学,说到底是因为知识的传播没法加速。你学会了微积分,你的同事不会因此也会微积分。每个人都要自己从头学。教育是人类社会里为数不多没办法靠复制来绕过的效率瓶颈。

AI 不一样。一个模型训练完成,它的能力可以被无穷复制。不需要让每一个 AI 实例都重新学 Python、重新刷统计学。训练一次,之后复制多少份都行。训练一个前沿模型的成本按亿算,但把它的能力复制给千万用户,新增的开销几乎为零。

从知识传播的角度看,教育 AI 这件事,技术上已经被解决了。那还谈什么给 AI 办大学?

智能可以复制,环境知识不能

模型掌握了通用知识,不等于它在一个具体的工作环境里知道该怎么做事。

一个 agent 会写代码,但它不知道在这家公司的代码库里什么叫写对了。它知道怎么调 API,但不知道这个团队的 API 文档和实际行为之间差了多少。它能生成分析报告,但不知道这个团队看报告的习惯是什么、关心哪几项指标、跳过什么部分。

这些东西不来自预训练,也不能靠分发模型来传递。它们是特定环境的运行知识,只有在这个环境里实际动手做事才能获得。这就是教育 AI 这个问题的第一个切入口:智能可以复制,但对具体工作环境的适配能力,复制不了。

那把环境知识写成文件,然后分发给所有需要的 agent,行不行?

老鸭汤:一套运行了半年的 AI 规则系统

行。我自己就有一套这样的系统,我和朋友们戏称它叫老鸭汤。

老鸭汤做的事不复杂:把工作规范、判断标准、犯过的错写进文件,agent 进来读完就知道这里的规矩,不用每次从零交代。核心思路是把 prompt 里反复出现的背景内容剥离出来,沉淀成持久化文件。agent 进门读一遍,该知道的就都知道了。

我在博客里写过完整的设计思路,也把参考实现开源在了 GitHub上。大半年用下来,效果一直很好。

但半年前做了一次全面审计之后,我发现了一个事先完全没预料到的问题。

分发出去的知识会退化

老鸭汤里积攒了一批祖传规则:没有人记得为什么存在的规则。

最典型的案例:有一条规则要求调用 Claude Code 时额外加一个特定参数。这条规则的来源是 2026 年初的一个 bug:Claude Code 的自适应思考机制有缺陷,特定情况下会把推理资源分配到零。我当时排查过这个问题,确认了 workaround 有效,把规则写进了文档。规则末尾还自己补了一句「如果上游修复了就回退」。

审计时我发现,这个 bug 几个月前就被修复了。规则还在。每一个新接手的 agent 读到这条规则,原样照做。没有任何一个知道为什么要这样做。也没有人定过什么时候该检查。

这件事的根因比单条规则过时更麻烦。经验变成文件的那一刻,发生了一次有损压缩。agent 在环境里碰壁、排查原因、找到规避方法,这个过程包含的信息量远超过一行指令:特定的系统版本、特定的错误模式、如果不这样做会有什么后果。这些是规则的发现上下文。但写成文件的时候,你保留得了的东西只有结论:加这个参数。几百行报错日志、版本号、排查推理过程,最后压成一行。

新 agent 读到这行指令,手中是一个没有前因的结论。它不知道这条规则保护什么,不知道前提条件是什么,不知道什么情况下可以不再遵守。它只能遵守。一个丢失了因果链的行为规则被当成不可质疑的指令来执行,这就是迷信的生成机制。

同一次审计还翻出了更多问题:规则索引里有重复条目,有断链指向已经改名的项目,公理系统的统计数字和实际数量对不上。每一个问题的源头都是同一个:系统只有 add 操作,没有 retire 操作。规则只能往里加,加进去就没人动它了。

人类组织管这个叫陈规陋习。AI 系统里出现了完全一样的东西,只是积累速度快了十倍。

规则文件更像教科书

我一直把老鸭汤当成 agent 的记忆。但记忆这个东西,绑在经历上。你记得为什么要加那个参数,是因为你亲历了那次故障,翻过那个 issue,验证过那个 workaround。记忆靠产生它的经历来保鲜。

文件做不到。文件和主体是分离的。它只记了结论,不携带经历。它不会自己更新,不会在前提消失时自动标记为过时。老鸭汤里那条已经作废的规则,就像一本十年前的教科书还在教你用软盘保存文件。教科书需要定期出修订版。

你坐在这里猜不出哪一页过时了,就像我坐在屏幕前猜不到那个 bug 已经被修复了。修订的唯一有效信号,来自学生回到实践中去碰壁。

裸跑:让环境来裁判

机制是这样的:定期派一个不携带任何旧规则的 agent 进入当前环境,执行真实任务。它拥有预训练的全部能力,但没有老鸭汤里积累的任何一个 workaround。

如果它顺利完成了任务,说明那些旧规则已经失效了。环境自己修复了,或者规则的前提条件已经消失。团队可以放心删掉它们。

如果它碰壁了,犯了和老鸭汤里记录的一模一样的错,说明规则还在保护系统。但这次碰壁多做了一件事:它在当下用当下的环境重新生成了一份新鲜的发现上下文。这份新的经历可以替换掉旧文件里那行干瘪的结论,让规则重新获得为什么要这样做的因果链。

三件事在这个动作里合为一体。考试,是 agent 在环境里的实际表现。教科书修订,是根据考试结果删掉死规则、刷新活规则。教育,是整个过程的净效果:老鸭汤变得新鲜,agent 对当前环境变得有用。学生的每一次碰壁,都是教科书再版的信号。

AI 大学做的事是年审

所以如果给 AI 办一所大学,它教的东西和人类的大学完全不同。预训练已经把全部通用知识给了 AI,这部分可以无限复制。这所大学的主要功能是反退化:定期把 agent 推回环境里裸跑,检验它继承的规则里哪些还活着、哪些已经退变成了祖传规则。活着的规则通过回归测试重新注入发现上下文,死掉的规则被清理出去。

它更像年审。你不需要每年重新考驾照,但车需要每年开回检测站,查一遍哪些零件还能用、哪些该换了。老鸭汤也需要这样的年审。否则它会在不知不觉中变成一本发霉的旧教科书,里头的每一条规则看上去都有道理,但没有人知道它们指向的到底还是不是当下的世界。

我这次手动清理了审计发现的几个最显眼的案例。但手动清理本身也只是一种临时手段。真正的解法是把年审变成自动化流程:定期跑一轮裸 agent 回归测试,让环境的真实反馈来决定哪些规则留、哪些规则走。到那一步,AI 大学就不仅是一个比喻了。它是一套可以工程化的制度,让规则系统在持续运行中靠环境的真实反馈来维持。

给 AI 办大学,最终交付的是一条对抗知识老化的年审流水线。它通过持续的检验和清理,让规则系统始终保持和真实世界的连接。

鸭哥每日手记

日更的深度AI新闻和分析