个人决策AI 编程

技术变革有两层红利，大部分人只拿到第一层

发布于 2026 年 5 月 28 日

最近和不少朋友聊 AI，有一个共同的感受：工具越来越强，但用了一阵之后，所有人都在做同一件事，写得更快、画得更快、查得更快。不是说这没用，而是如果 AI 带来的改变只是把现有工作加速 30%，那它就不是蒸汽机级别的变革。

问题出在，我们把目光停在了最显眼的地方。

集装箱教会我们的事

1956 年，一个叫 Malcom McLean 的卡车公司老板把第一艘集装箱船从纽瓦克开到了休斯顿。

在那之前，远洋运输是散货。一艘船到港，船舱里装的是各种形状的箱子、麻袋、桶、机械零件，每样东西尺寸不一、重量不一，只能靠码头工人一件一件搬下来。一艘中型货船的装卸，几百个工人干一周。这整件事非常离谱。当时海运的总成本超过一半是在装卸上面，船在港口停的时间比在海上跑的时间还长。

这样一来就造成一个现象：所有的工厂为了最小化装卸成本和时间，会尽可能离港口近，这样只要装一次就可以了。

集装箱出现以后，大家都知道，它就是一个标准尺寸的金属箱子，整箱装船、整箱卸船。一台龙门吊一分钟处理一个箱子，几个小时装卸完一艘船。装卸成本从几美元一吨降到几美分一吨。

这就是集装箱的第一层红利：装卸变快，成本降低。所有港口都能拿，大家也都在拿。到 1970 年代，主要远洋航线基本都换成了集装箱船。

但集装箱真正改写历史的地方不在这里。如果只有这一层，大家拿的红利其实很有限。更大的红利，甚至是改变全球秩序的红利，是另外一件事。

想这件事的是另一群人。他们注意到一个第一层覆盖不到的问题：装卸成本大幅降低以后，工厂选址不再绑死在靠近港口这个前提上。

散货时代，内陆生产意味着货物要先从工厂运到港口，拆装重组一次才能装船，到了目标港口又要拆装一次。每一次拆装成本都极其离谱。所以工厂选址的逻辑很简单：能少经过一次拆装就少经过一次，最优解是建在港口边。美国制造业过去集中在东北和五大湖区，纽约、芝加哥、底特律、匹兹堡，本质上都是港口或水路枢纽。

现在标准化金属箱可以在工厂、卡车、火车、轮船之间无缝流动，中间转四五次都不用打开。装卸节点的次数没变，但每个节点的成本降了几个数量级。工厂在内陆还是在港口，过去是两个世界的成本差异，现在变成可以忽略的差异。

这一点想通以后，整套工厂选址逻辑就变了。劳动力、土地这些过去装卸成本压住的变量，这时候才真正能起作用。美国制造业在 1970 到 90 年代经历了一次大迁移，工厂从东北和五大湖区搬到南方。亚拉巴马成为汽车制造中心，田纳西成为家电和汽车中心，南卡罗来纳的宝马工厂是宝马全球最大工厂。这些地方过去因为离港口远不可能成为制造业核心，集装箱来了之后变成了新中心。

两层红利的量级差别有多大呢。第一层是港口降本。第二层是整个全球工业地理重新洗牌。不只是一个量级的事情。

而且第二层不是自动来的。它需要一群人想清楚选址逻辑变了，愿意承担重新勘探、建厂、培训工人的代价。在那段时间窗口里，继续在港口区经营老工厂是安全选项。只有想通了第二层的人，愿意承担短期阵痛，拿到了量级更大的回报。

AI 的这两层分别在哪

把这个分析框架放到 AI 上看，事情就清楚了。

AI 的第一层红利，大家今天已经在拿。写代码更快、写文档更快、做设计更快、写文案更快，单点提效没问题，每个人都在往这里走。所有头部公司都在做，个体用户也不落后，在这一层上不会落后。但第一层红利只是一个入场条件，不是什么竞争优势。

AI 的第二层红利藏在一个更深的地方。集装箱改写历史的不是单次装卸变便宜，而是工厂选址从必须靠近港口这个约束里解了出来。AI 这里对应的是什么呢。工程任务中间转手成本的大幅降低。过去一个工具从想法到上线，要经过提需求、跨团队对齐、排期、前端、后端、QA、发布，每一次转手都有信息丢失、对齐成本、排队时间。这些加起来，不是单个环节慢，而是人与人、团队与团队之间的信息传递和等待，总成本大得离谱。AI 让一个人就能完成过去一整条链路的工作，这个变化一旦稳定下来，过去协作成本太高压住的做法，比如为临时问题做一个专用工具、一个人覆盖原本几个岗位的工作，会变成日常的决策选项。

这已经超出了优化的范畴。定价变了，过去最优的做法就不再最优。

一个具体的例子

注：以下 Pinterest 案例为构建的示意性 demo，用于演示 AI 改变工作流的逻辑，并非 Pinterest 公司实际发生的事件。

去年 Pinterest 上线了一个新产品叫 shoppable collages，用户可以看一组拼贴图片，每张图关联一个可购买商品。上线几周后数据回来，整体停留时间和互动都不错，但 actionability，也就是用户最终点击产品链接的比例，只有 0.6%，预期是 1%。对电商产品来说这个差距不小。

VP 把负责项目的数据科学家拉进 review，在一屋子主管面前问了一个问题：为什么。这个答案会决定下个季度一百多个工程师的资源投向。是产品整体战略定位有问题要推倒重来，还是工程实现有问题系统太慢了，还是用户画像有问题？总之这是一个很实际、工作中确实会碰到的决策场景。

在旧成本结构下，这位数据科学家的最优做法是节省代码。她面对一个数据科学内部的经典局面：速度、规模、可读性，只能三选二。跑 SQL 切片分析有速度有规模，但看不到切片内部到底发生了什么，你不知道用户到底干了啥。抽样读 session log 有可读性，但拉不全，数据格式乱，只能脑补。申请做 dashboard 有规模有可读性，但需要两周排期，老板明天就要，搞不定。

在这个约束下，她最后给 VP 的答案大概率是一段听起来合理但证据不够扎实的叙事。数据科学过去常常是这样：用讲故事的方式把聚合数字串起来，做一个听起来靠谱的推测，然后根据这个推测去安排一百多个人下面要干什么。

在这里我想稍微停一下。这不是这个分析师的问题，也不只是分析行业的问题，包括工程、包括 PM，全都是在这个价值体系下面培养出来的。想想看，我们平时怎么评价一个人厉害？像老中医一样，一搭脉就知道你有什么病，跟做 CT 出来的结果一样。一个工程师 debug，看两三个 log 就知道 bug 在哪，大家会觉得哇，这样的人很厉害。但如果一个人真的去看了几万行的 log，然后非常确定地告诉你这就是 bug，大家反而不觉得厉害。我们整个培养体系是在写代码很昂贵的时代建立起来的，所以自然而然推崇那种像柯南一样从稀疏线索还原真相的能力。但仔细想一下，这是一个很奇怪的能力。如果有条件拿到不稀疏的线索，为什么还要训练这个能力呢。

AI 改变了这件事。代码的边际成本大幅降低以后，她不再需要在这个三角里妥协。她直接为这个具体问题做了一个专门的观测工具：一个下午，几千行代码，带 web 前端，能交互。她第一个工具是行为可视化，把所有 session 的循环度得分画出来。结果不是一个正态分布，是一个清晰的双峰。转化用户行为直接，看到喜欢的就点击；未转化用户行为探索性强，反复绕圈子。

0.6% 这个平均值，把两种完全不同的人压在了一个数字里，掩盖了真相。不论选哪条路都不对，要分开处理。

她第二个工具叫 Session Explorer，把每个用户的交互生命线可视化。她发现在右侧高循环度峰里其实藏着两类人：一类在反复打开图片、保存、编辑、缩放，鬼打墙一样不停地调，他们享受创作，购买本来就不是他们的意图；另一类时间轴密密麻麻满是加载失败的红点，他们想买，但被基础设施摩擦挡住了，系统太慢了。

她把这三张图带回 VP 的会议室，没有讲一个听起来合理的故事，而是给了一个分层的、有物理证据的结论：0.6% 不是单一问题，是两个问题混在了一起。一半是 segmentation，这些人根本不是来买东西的，产品定位需要重新想。一半是 friction，这些人想买但走不到，工程链路需要修。两个问题需要完全不同的方案。

到这里说的还是第一层：她用 AI 把数据分析做得更深更快更有说服力。

但把视角拉远一步，第二层就出来了。她做的这两个工具加在一起几千行代码，带 web 前端。在旧成本结构下，这是一个标准工程立项：数据分析师写 spec，前端做 UI，后端做 pipeline，UX 设计师做交互，PM 协调。从立项到上线两到三个月起步。她现在一个人一个下午做完了。

这里容易得出一个错误结论：AI 让她变成超人。不是。她的判断力、对业务的理解、对数据的敏感度还是原来那个人，她写的代码放到专业前端手里大概率有各种可以挑剔的地方。

真正发生的是这五个岗位的能力在她身上完成了有机整合。过去五个人协作，每个人只能看见自己岗位那一面的信息：数据分析师看见数字，前端看见 UI，后端看见 pipeline，设计师看见交互，PM 看见进度。完整画面不存在于任何一个人脑子里，只存在于会议纪要、设计文档、跨团队同步会的总和里。而这些载体里的信息永远是部分丢失、不同步的。

问题的关键不在于她省了几个 head count，而在于她做出了就算有这些 head count 也不一定能做出来的东西。她一个人加 AI，在写前端代码的时候知道这些数字背后的业务含义，在做交互的时候知道用户行为数据里那些信号意味着什么。双峰分布、segmentation 和 friction 的混合、创作者和摩擦用户的并存，这些发现不是任何单一岗位能看到的。它们存在于岗位之间的接缝里，而岗位之间的接缝在传统工作流里是信息丢失最严重的地方。很多你明明一个人做的时候能捕捉到的机会，在这些层层摩擦中间就没有了。当这些接缝被打通以后，整个能力的天花板就跃迁了。

定价变了，最优策略就变了

回到集装箱那个故事。从 McLean 的第一艘船开走到全球工厂选址完成第一波重组，中间大概三十年。这三十年里，所有港口都在拿第一层红利。拿到第二层红利的工厂主大部分集中在前十到十五年，也就是那些先想清楚、先动手、先承担重组成本的人。等到 1980 年代末第二层变成显学的时候，跟随者拿到的回报已经远不如先行者。

AI 现在处在哪个阶段呢。第一层红利大家都在拿，这没问题。拿到第一层你只是没有落后，不等于你领先。第二层的窗口刚刚打开。

说一个更近的例子。传统的 code review 有两个功能：发现错误和知识传递。这两件事在写代码很贵、写代码很慢的时代是成立的：发现 bug 避免昂贵的修复，老员工带新员工把知识传递下去。AI 同时削弱了这两个功能。模式性错误，比如 null dereference、死锁、资源泄露，AI 比人更快更全面更不会漏。而知识传递这件事，在代码本身可以被 AI 重新生成的环境里，真正稀缺的不再是代码细节，而是意图细节、业务约束、设计取舍。这些东西过去在 code review 里读不到，它们藏在 spec、藏在群聊、藏在某个人的脑子里。

Anthropic 内部在试一种做法：两层审查。AI 审实现：风格、安全性、边界情况；人审意图：技术方案、业务逻辑、设计取舍。这不是把 code review 交给 AI，是把这件事重新分了一遍。把原先由人做的体力活抽出来交给 AI，让人去做更上游的判断。他们的工程负责人 Boris Cherny 说每个 PR 都会先经过 Claude Code 审查作为第一道检查，它发现的 bug 细节程度让他震惊。

回到自己身上

集装箱的故事里有一个细节容易被忽略：从散货到集装箱，不是港口工人不够努力，也不是他们不想变革，而是装卸这件事本身的成本结构决定了所有人的行为逻辑。当成本结构变了，过去最好的做法就不再是最好的做法。

AI 时代也一样。问题不是你能不能把现在的事情做得更快更便宜，而是现在做的事情本身，它隐含的那些基本假设是不是已经被动摇。以前代码很贵，所以最优策略是珍惜代码，让专业的人做专业的事。现在代码变便宜了，最优策略可能是花代码、消耗代码，不再因为写代码门槛高而把一件事拆成五个人来做。

AI 带来的红利，不是说我们能做更快，而是我们发现可以开始做不一样的事了。围绕以前旧定价所构建的最优策略，都需要再看一下，需要 unlearn 一下。它不一定要改，但至少要问一问：这个东西的前提还成立吗。

选一件你最近想搞清楚的事，用 AI 自己跑一遍。省时间是副产品，真正要建立的是对定价变化的体感。你得到的不只是这件事的答案，更是对什么东西已经不一样了的判断。这才是一个人的第二层红利的入口。