个人决策社区与认知

什么时候该要 Alpha，什么时候该要 Beta

发布于 2026 年 6 月 1 日

陈然写了一段话，核心意思是：大多数人在人生的方方面面找 alpha，但真正该做的是在大多数领域追求 beta，也就是零努力的被动收益，只在极少的地方追求 alpha。

这段话点出了一个普遍的问题，但它把最难的部分藏在了「只在极少的地方追求 alpha」这句话里。哪几个地方？怎么判断？如果 alpha 本身有好有坏，坏的是哪种，好的是哪种？真正的问题在于搞清楚什么时候该追、什么时候不该追，以及凭什么这样判断。

Alpha 的两种形态：Tweak 和 Build

日常生活中所谓的追求 alpha，其实包含两种完全不同的行为。

一种是 tweak。在已有的系统上做边际优化：改 prompt、调配置、研究信用卡规则、选股、比价。特点是系统已经存在，你做的事是让它对你个人的输出好一点点。

另一种是 build。从零开始或者在一个不成熟的领域里建造新东西：写一个工具、设计一套工作流、建立一个创作系统、搭建一个社区。特点是你在创造新的结构，不是在已有结构上做微调。

这两种 alpha 的反馈结构完全不同。Tweak 的反馈闭环通常很长、噪音很大。你改了一个 prompt，要等至少几轮对话才能判断效果，中间还夹杂模型抽风、任务差异、你自己的使用习惯变化。你研究一个投资策略，回测看起来好，但实盘要等几年才知道是不是运气。反馈模糊到这种程度，学习几乎无法积累。你今天觉得这个 prompt 模板很好，可能只是因为今天恰好问了对的问题。

Build 的反馈闭环短得多。你做了一个工具，别人能不能用，用得好不好，很快就能知道。你建了一套工作流，跑一个月就知道哪里卡。信号足够清楚，迭代就能积累。

这个区分不是学术上的分类。它的实际后果是：大多数人以为自己在追求 alpha，其实只是在做 tweak，而 tweak 型 alpha 的收益期望值，在大多数领域是负的。因为你花的时间是确定的，收益是不确定的，系统自身升级还会覆盖你的优化。陈然说的「搞 prompt 优化的人大多数还不如等工具自己升级来得多」，指的正是 tweak 型 alpha。

Tweak 为什么打不过 Beta

Tweak 型 alpha 面临一个结构性问题：你优化的对象本身在进化，而且进化速度可能比你快。

你在 Claude Code 里精心调试了一个 prompt 模板，两个月后模型升级了，你的模板效果突然变差，甚至不如新模型的默认行为。你花时间研究了一套 vim 插件组合，半年后 IDE 把这些功能做进了原生。你花一周比较了五款机械键盘，一年后轴体换代，你的知识归零。

这里的底层机制是：alpha 有半衰期，beta 有复利。 你做的每一个 tweak 都在随时间贬值，贬值速度取决于底层系统的进化速度。系统进化越快，alpha 的半衰期越短。而 beta 刚好相反：你把自己挂在一个正趋势上，系统的每一次进化自动反映到你的收益里。

这不是说 tweak 永远不值得做。有些系统进化很慢，比如你对某个编程语言的基础理解、你对写作结构的把握。这些地方的 tweak 半衰期长，可能可以积累。但大多数工具、消费选择、理财策略的底层系统进化速度都很快，tweak 的半衰期短到不值得进场。

陈然举的例子都符合这个模式。投资：你选的个股跑赢标普 500 的概率，在你花的时间超过某个阈值之后急剧下降。信用卡：2% 无年费返现是 beta，规则稳定，半衰期长。年费卡羊毛是 tweak，每一张卡的点数价值、种类限制、兑换规则都在变化，你的知识每次规则更新就被清零一部分。Claude Code：直接用是 beta，每次升级自动受益。研究 MCP 和 agent 框架是 tweak，框架和协议还在剧烈迭代期，你今天搭的东西半年后大概率需要重来。

什么时候该选 Alpha

Tweak 型 alpha 排除之后，剩下的情况才是 alpha 真正该出现的地方。判断一个领域该不该投入 alpha 精力，主要有三个维度。

第一个维度是复利潜力。你在这个领域的改进能不能长期积累，还是每次都要重新学？写作能力、编程基本功、对某个行业的深度理解、一套你自己维护的创作系统，这些东西的改进可以持续十年以上。相比之下，某个工具的最佳配置、某次消费的最优选择，用完就没了。复利潜力的判断标准是：如果这个领域的改进是一件你可以做二十年的事，它可能有复利。如果它的保质期不超过两年，它大概率没有。

第二个维度是反馈质量。你做对还是做错，多快能知道？信号强度够不够排除运气？如果你做一个产品，用户反馈在几天内就能告诉你方向对不对，这是高质量反馈。如果你做健康管理，体重、睡眠、血液指标在周级别就能反映变化，这也是可用的反馈。如果你做投资，你根本无法在一年以内区分能力和运气，这就是低质量反馈。反馈质量决定了你能不能在合理的时间内从错误中学到东西。如果学不到，你只是在随机游走。

第三个维度是你的比较优势。这一点最难诚实评估。大多数聪明人对自己在每个领域的比较优势都高估了。觉得自己比平均水平聪明，所以研究一下就能超过默认方案。但默认方案本身就是由大量聪明人共同迭代出来的。标普 500 的定价里包含了所有市场参与者的判断，Claude Code 的默认行为里包含了模型团队和海量用户的反馈。你一上来就觉得能超过它，从概率上说不太对。

一个可操作的评估方法：看历史记录，不要靠感受。你过去在这个领域做的优化，有没有产生过可验证的、持续的正收益？如果有，记录在哪儿？如果没有记录，或者记录显示收益不明显，你的比较优势大概率不存在。

三个维度都满足的领域：复利潜力高、反馈质量好、你确实有比较优势。这种领域就是你的 active alpha zone，数量应该限制在一到两个。

只满足一两个维度的领域：比如复利高但反馈差（健康管理、投资），或者反馈好但复利低（日常工具选择）。这些属于灰色地带。处理方式是给它们分配有限的 alpha 预算，而不是随时可以进场。比如健康管理可以用代理指标把反馈提前：关注体重趋势而非每天的感觉。投资可以用资产配置代替选股，把 alpha 问题转换成 beta 问题。

三个维度都不满足的领域：果断 beta。挑一个默认方案，停下来。

最难的地方：看到不等于应该做

这个框架不难理解，但在执行层面有一个深层障碍。聪明人之所以在每个领域都追 alpha，恰好因为他们确实看得到改进空间。

你看一眼某个工具，马上就知道哪里可以配置得更合理。你看一眼某个流程，马上就知道哪里可以省一步。这种能力不是幻觉，它真实存在。问题在于：能看到的改进空间，不等于值得填的改进空间。

因为看到改进空间只说明了你在这个领域的相对感知能力，它什么都没说明这个改进本身的价值大小。你能看到酒店价格有 8% 的优化空间，不代表你花三十分钟去省这 8% 是划算的。你能看到 prompt 有优化空间，不代表你今天优化的东西三个月后还在。

这个误区有一个简单但有效的检验方法：把改进用时间价值换算一下。如果你每小时的时间值 X 元，优化这件事能省下的金额或节省的时间，乘以你预期这个改进能持续的年数，如果算下来连你自己时薪的一半都不到，那它不应该进入你的 alpha zone。它未必不成立，但它的代价是把注意力从更好的去处抽走了。

另一个检验方法是问：这个改进能不能迁移？你花时间优化的这个 prompt 模板，能不能用于其他场景？你研究的这个信用卡策略，能不能帮你理解财务系统的运作？如果答案是不能，它就是一锤子买卖。一锤子买卖不配叫 alpha。

把 Beta 选好，本身是需要判断力的

还有一个经常被忽略的点：选 beta 不是随便选，它也需要判断力。只是这个判断力用在了选轨道上，而不是用在了轨道内的跑步姿势上。

好的 beta 有几个特征。第一，它背后的系统有强竞争在推动进化。AI 编程工具现在有四五个大玩家在互相卷，你挂上任何一个主流工具都能吃到竞争红利。第二，它的升级会自动进入你的工作流，不需要你重新学习或迁移。第三，切换成本低。如果这个系统有一天变差了，你能无痛换到另一个。

反过来，差的 beta 是那些看起来稳定但其实在萎缩的系统，或者是那些升级需要你不断重新适应的系统。

所以 beta 的选题能力，本质上是对趋势的判断力。你在判断哪个系统会长期向上，而不是在判断系统内部的哪个参数最优。这也是为什么陈然说「等着 CC 或 Codex 升级」不是一个消极行为，它是一个积极的 beta 选择。

结论

回到陈然的那段话。他说的「只在极少的地方追求 alpha」，这句话的难度不在于「少」，而在于你需要在每个领域都做一次判断，然后把大部分结果判成 beta。

这个判断有三个支柱：复利潜力和反馈质量决定这个领域值不值得你进去，比较优势决定你进去之后能不能赢。三个支柱都站住的领域，可能只有一两个。剩下的，挑一个好的 beta 挂上去，然后把省出来的注意力全部投进那仅有的几个 alpha zone。

这不是偷懒。这是资源配置。