个人决策AI 编程

技术变革有两层红利,大部分人只拿到第一层

最近和不少朋友聊 AI,有一个共同的感受:工具越来越强,但用了一阵之后,所有人都在做同一件事,写得更快、画得更快、查得更快。不是说这没用,而是如果 AI 带来的改变只是把现有工作加速 30%,那它就不是蒸汽机级别的变革。

问题出在,我们把目光停在了最显眼的地方。

集装箱教会我们的事

1956 年,一个叫 Malcom McLean 的卡车公司老板把第一艘集装箱船从纽瓦克开到了休斯顿。

在那之前,远洋运输是散货。一艘船到港,船舱里装的是各种形状的箱子、麻袋、桶、机械零件,每样东西尺寸不一、重量不一,只能靠码头工人一件一件搬下来。一艘中型货船的装卸,几百个工人干一周。这整件事非常离谱。当时海运的总成本超过一半是在装卸上面,船在港口停的时间比在海上跑的时间还长。

这样一来就造成一个现象:所有的工厂为了最小化装卸成本和时间,会尽可能离港口近,这样只要装一次就可以了。

集装箱出现以后,大家都知道,它就是一个标准尺寸的金属箱子,整箱装船、整箱卸船。一台龙门吊一分钟处理一个箱子,几个小时装卸完一艘船。装卸成本从几美元一吨降到几美分一吨。

这就是集装箱的第一层红利:装卸变快,成本降低。所有港口都能拿,大家也都在拿。到 1970 年代,主要远洋航线基本都换成了集装箱船。

但集装箱真正改写历史的地方不在这里。如果只有这一层,大家拿的红利其实很有限。更大的红利,甚至是改变全球秩序的红利,是另外一件事。

想这件事的是另一群人。他们注意到一个第一层覆盖不到的问题:装卸成本大幅降低以后,工厂选址不再绑死在靠近港口这个前提上。

散货时代,内陆生产意味着货物要先从工厂运到港口,拆装重组一次才能装船,到了目标港口又要拆装一次。每一次拆装成本都极其离谱。所以工厂选址的逻辑很简单:能少经过一次拆装就少经过一次,最优解是建在港口边。美国制造业过去集中在东北和五大湖区,纽约、芝加哥、底特律、匹兹堡,本质上都是港口或水路枢纽。

现在标准化金属箱可以在工厂、卡车、火车、轮船之间无缝流动,中间转四五次都不用打开。装卸节点的次数没变,但每个节点的成本降了几个数量级。工厂在内陆还是在港口,过去是两个世界的成本差异,现在变成可以忽略的差异。

这一点想通以后,整套工厂选址逻辑就变了。劳动力、土地这些过去装卸成本压住的变量,这时候才真正能起作用。美国制造业在 1970 到 90 年代经历了一次大迁移,工厂从东北和五大湖区搬到南方。亚拉巴马成为汽车制造中心,田纳西成为家电和汽车中心,南卡罗来纳的宝马工厂是宝马全球最大工厂。这些地方过去因为离港口远不可能成为制造业核心,集装箱来了之后变成了新中心。

两层红利的量级差别有多大呢。第一层是港口降本。第二层是整个全球工业地理重新洗牌。不只是一个量级的事情。

而且第二层不是自动来的。它需要一群人想清楚选址逻辑变了,愿意承担重新勘探、建厂、培训工人的代价。在那段时间窗口里,继续在港口区经营老工厂是安全选项。只有想通了第二层的人,愿意承担短期阵痛,拿到了量级更大的回报。

集装箱的两层红利

AI 的这两层分别在哪

把这个分析框架放到 AI 上看,事情就清楚了。

AI 的第一层红利,大家今天已经在拿。写代码更快、写文档更快、做设计更快、写文案更快,单点提效没问题,每个人都在往这里走。所有头部公司都在做,个体用户也不落后,在这一层上不会落后。但第一层红利只是一个入场条件,不是什么竞争优势。

AI 的第二层红利藏在一个更深的地方。集装箱改写历史的不是单次装卸变便宜,而是工厂选址从必须靠近港口这个约束里解了出来。AI 这里对应的是什么呢。工程任务中间转手成本的大幅降低。过去一个工具从想法到上线,要经过提需求、跨团队对齐、排期、前端、后端、QA、发布,每一次转手都有信息丢失、对齐成本、排队时间。这些加起来,不是单个环节慢,而是人与人、团队与团队之间的信息传递和等待,总成本大得离谱。AI 让一个人就能完成过去一整条链路的工作,这个变化一旦稳定下来,过去协作成本太高压住的做法,比如为临时问题做一个专用工具、一个人覆盖原本几个岗位的工作,会变成日常的决策选项。

这已经超出了优化的范畴。定价变了,过去最优的做法就不再最优。

一个具体的例子

注:以下 Pinterest 案例为构建的示意性 demo,用于演示 AI 改变工作流的逻辑,并非 Pinterest 公司实际发生的事件。

去年 Pinterest 上线了一个新产品叫 shoppable collages,用户可以看一组拼贴图片,每张图关联一个可购买商品。上线几周后数据回来,整体停留时间和互动都不错,但 actionability,也就是用户最终点击产品链接的比例,只有 0.6%,预期是 1%。对电商产品来说这个差距不小。

VP 把负责项目的数据科学家拉进 review,在一屋子主管面前问了一个问题:为什么。这个答案会决定下个季度一百多个工程师的资源投向。是产品整体战略定位有问题要推倒重来,还是工程实现有问题系统太慢了,还是用户画像有问题?总之这是一个很实际、工作中确实会碰到的决策场景。

在旧成本结构下,这位数据科学家的最优做法是节省代码。她面对一个数据科学内部的经典局面:速度、规模、可读性,只能三选二。跑 SQL 切片分析有速度有规模,但看不到切片内部到底发生了什么,你不知道用户到底干了啥。抽样读 session log 有可读性,但拉不全,数据格式乱,只能脑补。申请做 dashboard 有规模有可读性,但需要两周排期,老板明天就要,搞不定。

数据科学的经典不可能三角

在这个约束下,她最后给 VP 的答案大概率是一段听起来合理但证据不够扎实的叙事。数据科学过去常常是这样:用讲故事的方式把聚合数字串起来,做一个听起来靠谱的推测,然后根据这个推测去安排一百多个人下面要干什么。

在这里我想稍微停一下。这不是这个分析师的问题,也不只是分析行业的问题,包括工程、包括 PM,全都是在这个价值体系下面培养出来的。想想看,我们平时怎么评价一个人厉害?像老中医一样,一搭脉就知道你有什么病,跟做 CT 出来的结果一样。一个工程师 debug,看两三个 log 就知道 bug 在哪,大家会觉得哇,这样的人很厉害。但如果一个人真的去看了几万行的 log,然后非常确定地告诉你这就是 bug,大家反而不觉得厉害。我们整个培养体系是在写代码很昂贵的时代建立起来的,所以自然而然推崇那种像柯南一样从稀疏线索还原真相的能力。但仔细想一下,这是一个很奇怪的能力。如果有条件拿到不稀疏的线索,为什么还要训练这个能力呢。

AI 改变了这件事。代码的边际成本大幅降低以后,她不再需要在这个三角里妥协。她直接为这个具体问题做了一个专门的观测工具:一个下午,几千行代码,带 web 前端,能交互。她第一个工具是行为可视化,把所有 session 的循环度得分画出来。结果不是一个正态分布,是一个清晰的双峰。转化用户行为直接,看到喜欢的就点击;未转化用户行为探索性强,反复绕圈子。

0.6% 这个平均值,把两种完全不同的人压在了一个数字里,掩盖了真相。不论选哪条路都不对,要分开处理。

她第二个工具叫 Session Explorer,把每个用户的交互生命线可视化。她发现在右侧高循环度峰里其实藏着两类人:一类在反复打开图片、保存、编辑、缩放,鬼打墙一样不停地调,他们享受创作,购买本来就不是他们的意图;另一类时间轴密密麻麻满是加载失败的红点,他们想买,但被基础设施摩擦挡住了,系统太慢了。

她把这三张图带回 VP 的会议室,没有讲一个听起来合理的故事,而是给了一个分层的、有物理证据的结论:0.6% 不是单一问题,是两个问题混在了一起。一半是 segmentation,这些人根本不是来买东西的,产品定位需要重新想。一半是 friction,这些人想买但走不到,工程链路需要修。两个问题需要完全不同的方案。

到这里说的还是第一层:她用 AI 把数据分析做得更深更快更有说服力。

但把视角拉远一步,第二层就出来了。她做的这两个工具加在一起几千行代码,带 web 前端。在旧成本结构下,这是一个标准工程立项:数据分析师写 spec,前端做 UI,后端做 pipeline,UX 设计师做交互,PM 协调。从立项到上线两到三个月起步。她现在一个人一个下午做完了。

这里容易得出一个错误结论:AI 让她变成超人。不是。她的判断力、对业务的理解、对数据的敏感度还是原来那个人,她写的代码放到专业前端手里大概率有各种可以挑剔的地方。

真正发生的是这五个岗位的能力在她身上完成了有机整合。过去五个人协作,每个人只能看见自己岗位那一面的信息:数据分析师看见数字,前端看见 UI,后端看见 pipeline,设计师看见交互,PM 看见进度。完整画面不存在于任何一个人脑子里,只存在于会议纪要、设计文档、跨团队同步会的总和里。而这些载体里的信息永远是部分丢失、不同步的。

问题的关键不在于她省了几个 head count,而在于她做出了就算有这些 head count 也不一定能做出来的东西。她一个人加 AI,在写前端代码的时候知道这些数字背后的业务含义,在做交互的时候知道用户行为数据里那些信号意味着什么。双峰分布、segmentation 和 friction 的混合、创作者和摩擦用户的并存,这些发现不是任何单一岗位能看到的。它们存在于岗位之间的接缝里,而岗位之间的接缝在传统工作流里是信息丢失最严重的地方。很多你明明一个人做的时候能捕捉到的机会,在这些层层摩擦中间就没有了。当这些接缝被打通以后,整个能力的天花板就跃迁了。

定价变了,最优策略就变了

回到集装箱那个故事。从 McLean 的第一艘船开走到全球工厂选址完成第一波重组,中间大概三十年。这三十年里,所有港口都在拿第一层红利。拿到第二层红利的工厂主大部分集中在前十到十五年,也就是那些先想清楚、先动手、先承担重组成本的人。等到 1980 年代末第二层变成显学的时候,跟随者拿到的回报已经远不如先行者。

AI 现在处在哪个阶段呢。第一层红利大家都在拿,这没问题。拿到第一层你只是没有落后,不等于你领先。第二层的窗口刚刚打开。

说一个更近的例子。传统的 code review 有两个功能:发现错误和知识传递。这两件事在写代码很贵、写代码很慢的时代是成立的:发现 bug 避免昂贵的修复,老员工带新员工把知识传递下去。AI 同时削弱了这两个功能。模式性错误,比如 null dereference、死锁、资源泄露,AI 比人更快更全面更不会漏。而知识传递这件事,在代码本身可以被 AI 重新生成的环境里,真正稀缺的不再是代码细节,而是意图细节、业务约束、设计取舍。这些东西过去在 code review 里读不到,它们藏在 spec、藏在群聊、藏在某个人的脑子里。

Anthropic 内部在试一种做法:两层审查。AI 审实现:风格、安全性、边界情况;人审意图:技术方案、业务逻辑、设计取舍。这不是把 code review 交给 AI,是把这件事重新分了一遍。把原先由人做的体力活抽出来交给 AI,让人去做更上游的判断。他们的工程负责人 Boris Cherny 说每个 PR 都会先经过 Claude Code 审查作为第一道检查,它发现的 bug 细节程度让他震惊。

回到自己身上

集装箱的故事里有一个细节容易被忽略:从散货到集装箱,不是港口工人不够努力,也不是他们不想变革,而是装卸这件事本身的成本结构决定了所有人的行为逻辑。当成本结构变了,过去最好的做法就不再是最好的做法。

AI 时代也一样。问题不是你能不能把现在的事情做得更快更便宜,而是现在做的事情本身,它隐含的那些基本假设是不是已经被动摇。以前代码很贵,所以最优策略是珍惜代码,让专业的人做专业的事。现在代码变便宜了,最优策略可能是花代码、消耗代码,不再因为写代码门槛高而把一件事拆成五个人来做。

AI 带来的红利,不是说我们能做更快,而是我们发现可以开始做不一样的事了。围绕以前旧定价所构建的最优策略,都需要再看一下,需要 unlearn 一下。它不一定要改,但至少要问一问:这个东西的前提还成立吗。

选一件你最近想搞清楚的事,用 AI 自己跑一遍。省时间是副产品,真正要建立的是对定价变化的体感。你得到的不只是这件事的答案,更是对什么东西已经不一样了的判断。这才是一个人的第二层红利的入口。

鸭哥每日手记

日更的深度AI新闻和分析