AI 编程AI Agent产业与竞争

AI 编程的下一个变化:从盯着改到整个交出去

你大概这样用 AI 写代码:打开 Cursor 或 Claude Code,描述你要什么,agent 生成代码,你盯着看,哪里不对让它改,几分钟到半小时搞定一个任务。

但正在出现另一种用法。你把一整个任务交给 agent,比如”把这个模块从旧框架迁到新框架”,或者”查清这个 bug 为什么会间歇性出现然后修掉”,然后关掉电脑,去开会,去睡觉。几小时或者一两天之后,回来看结果。

这种用法现在还早期。Goldman Sachs 从 2025 年 7 月开始试点 Devin,到现在仍在持续扩展(CNBC)。独立 benchmark 上,这类 agent 的复杂任务成功率还远低于交互式模式。方向已经清楚了:OpenAI、Google、Anthropic 三家前沿 lab 都在为这种用法专门建云端运行环境,2026 年 6 月一周里落了三笔并购:SpaceX 花 600 亿美元收 Cursor(Reuters),OpenAI 收 Ona,Salesforce 花 36 亿美元收 Fin,全指向同一个方向。

这篇文章讲为什么。

这不是盯着改的升级版

盯着改和整个交出去,看起来像同一种工作的快慢版本。其实是两种不同性质的工作。

盯着改的时候,agent 是你的工具。你全程在场,它帮你加速。你能做的任务受限于你的注意力和在场时间:改一个函数,修一个小 bug,加一个功能。

整个交出去的时候,agent 是你的执行者。你给一个目标,它自己去探索、试错、完成。它能做的任务,是盯着改根本做不了的。

比如同时重构十个代码仓库的依赖,花两天追踪一个跨系统的间歇性 bug,把一整个模块从旧架构迁到新架构。这些任务,盯着改做不到。它们需要 agent 自己长时间探索、不断试错、来回回溯,人在旁边盯着既看不懂它在中途干什么,也帮不上忙。

所以长时间运行这件事重要的原因,在于它打开了一类盯着改根本进不去的任务。速度提升只是附带的效果。能做什么这件事变了,比做得快不快重要得多。

你从执行者变成了管理者

盯着改的时候,你同时只能管一个 agent。你的注意力被绑在它的执行过程上。就算它全做对了,你也得盯着,因为你需要在它出错的时候立刻纠正。

整个交出去之后,这个限制消失了。你可以同时交出去五个任务,每个 agent 在不同分支上自己跑。你去开会,去做设计,去带孩子,回来挨个看结果。

你从亲手干活的人,变成了管一堆 agent 的人。这两种角色的生产力上限完全不同。一个人盯着一个 agent 改代码,和一个人同时管五个 agent 各自跑完整任务,中间差好几倍。

这个变化对外面看的人可能不明显,对正在用这些工具的人是切身的。你现在花在”盯着 agent 改代码”上的时间,大部分会变成”给 agent 分活、看结果、做判断”的时间。省下来的注意力,可以同时管更多任务,也可以去做 agent 做不了的事。

那你还能干什么

当 agent 能整个接住任务,写代码这件事本身就被它吃掉了。

你的价值剩下两层:决定该做什么,以及判断做得好不好。

“开发者”这个角色在重新定义。从”会写代码的人”,变成”知道该做什么、能判断结果的人”。

这个变化比前面两个都深。前两个说的是工作方式和效率,这个说的是你这个人靠什么吃饭。写代码变成了 agent 的事,你的核心资产变成了品味、判断力和方向感:知道什么是值得做的,什么做好了什么没做好。

对已经在写代码的人来说,这意味着经验里的高阶部分在升值,低阶部分在贬值。系统设计、问题诊断、取舍判断在升;语法、模板、重复实现在降。对刚入行的人来说门槛变了:过去靠写代码建立价值,以后写代码这件事不太需要人做了,得靠别的途径积累判断力。

为什么巨头愿意花 600 亿

盯着改的 agent 积累的是什么数据?你改了什么、接受了还是拒绝了它的建议。交互片段。

整个交出去的 agent 积累的是什么?完整的任务生命周期:一个复杂任务怎么被拆成几步,中间在哪里卡住,怎么恢复,怎么验证做对了。任务级的完整记录。

后者的训练价值远高于前者。想训练一个能独立完成复杂任务的下一代 agent,你需要大量”完整任务怎么做”的数据,光靠”这段代码怎么补”的数据训练不出来。

这就解释了三笔并购的底层逻辑。SpaceX 花 600 亿买 Cursor,买的不是 IDE 的用户量,是开发者做设计决策的过程数据。OpenAI 买 Ona(公告),买的是让 agent 长时间安全运行的基础设施。Salesforce 买 Fin,买的是客服场景里 agent 独立完成任务的完整记录。

三家买的标的完全不同,底层逻辑一样:谁拥有长时间运行 agent 的完整数据和运行环境,谁就在下一代竞争中占据位置。

这意味着什么

三笔并购是表面信号。底下同时发生的是三层变化。

工作方式从盯着改变成整个交出去。人的角色从执行者变成管理者。核心能力从写代码变成判断该做什么、做得好不好。

对正在用 AI 写代码的人来说,该关注的不是”哪个工具更好用”,是”我能不能把整个任务交出去”。以及更重要的:交出去之后,我的价值在哪。

这个变化现在还早期。agent 能稳定完成复杂任务的比例还不高。但三家前沿 lab 用自己的工程投资投了票,三笔并购用真金白银投了票。方向清楚之后,剩下的只是时间和迭代。

鸭哥每日手记

日更的深度AI新闻和分析