个人决策社区与认知

什么时候该要 Alpha,什么时候该要 Beta

陈然写了一段话,核心意思是:大多数人在人生的方方面面找 alpha,但真正该做的是在大多数领域追求 beta,也就是零努力的被动收益,只在极少的地方追求 alpha。

这段话点出了一个普遍的问题,但它把最难的部分藏在了「只在极少的地方追求 alpha」这句话里。哪几个地方?怎么判断?如果 alpha 本身有好有坏,坏的是哪种,好的是哪种?真正的问题在于搞清楚什么时候该追、什么时候不该追,以及凭什么这样判断。

Alpha 的两种形态:Tweak 和 Build

日常生活中所谓的追求 alpha,其实包含两种完全不同的行为。

一种是 tweak。在已有的系统上做边际优化:改 prompt、调配置、研究信用卡规则、选股、比价。特点是系统已经存在,你做的事是让它对你个人的输出好一点点。

另一种是 build。从零开始或者在一个不成熟的领域里建造新东西:写一个工具、设计一套工作流、建立一个创作系统、搭建一个社区。特点是你在创造新的结构,不是在已有结构上做微调。

这两种 alpha 的反馈结构完全不同。Tweak 的反馈闭环通常很长、噪音很大。你改了一个 prompt,要等至少几轮对话才能判断效果,中间还夹杂模型抽风、任务差异、你自己的使用习惯变化。你研究一个投资策略,回测看起来好,但实盘要等几年才知道是不是运气。反馈模糊到这种程度,学习几乎无法积累。你今天觉得这个 prompt 模板很好,可能只是因为今天恰好问了对的问题。

Build 的反馈闭环短得多。你做了一个工具,别人能不能用,用得好不好,很快就能知道。你建了一套工作流,跑一个月就知道哪里卡。信号足够清楚,迭代就能积累。

这个区分不是学术上的分类。它的实际后果是:大多数人以为自己在追求 alpha,其实只是在做 tweak,而 tweak 型 alpha 的收益期望值,在大多数领域是负的。因为你花的时间是确定的,收益是不确定的,系统自身升级还会覆盖你的优化。陈然说的「搞 prompt 优化的人大多数还不如等工具自己升级来得多」,指的正是 tweak 型 alpha。

Tweak 为什么打不过 Beta

Tweak 型 alpha 面临一个结构性问题:你优化的对象本身在进化,而且进化速度可能比你快。

你在 Claude Code 里精心调试了一个 prompt 模板,两个月后模型升级了,你的模板效果突然变差,甚至不如新模型的默认行为。你花时间研究了一套 vim 插件组合,半年后 IDE 把这些功能做进了原生。你花一周比较了五款机械键盘,一年后轴体换代,你的知识归零。

这里的底层机制是:alpha 有半衰期,beta 有复利。 你做的每一个 tweak 都在随时间贬值,贬值速度取决于底层系统的进化速度。系统进化越快,alpha 的半衰期越短。而 beta 刚好相反:你把自己挂在一个正趋势上,系统的每一次进化自动反映到你的收益里。

这不是说 tweak 永远不值得做。有些系统进化很慢,比如你对某个编程语言的基础理解、你对写作结构的把握。这些地方的 tweak 半衰期长,可能可以积累。但大多数工具、消费选择、理财策略的底层系统进化速度都很快,tweak 的半衰期短到不值得进场。

陈然举的例子都符合这个模式。投资:你选的个股跑赢标普 500 的概率,在你花的时间超过某个阈值之后急剧下降。信用卡:2% 无年费返现是 beta,规则稳定,半衰期长。年费卡羊毛是 tweak,每一张卡的点数价值、种类限制、兑换规则都在变化,你的知识每次规则更新就被清零一部分。Claude Code:直接用是 beta,每次升级自动受益。研究 MCP 和 agent 框架是 tweak,框架和协议还在剧烈迭代期,你今天搭的东西半年后大概率需要重来。

什么时候该选 Alpha

Tweak 型 alpha 排除之后,剩下的情况才是 alpha 真正该出现的地方。判断一个领域该不该投入 alpha 精力,主要有三个维度。

第一个维度是复利潜力。你在这个领域的改进能不能长期积累,还是每次都要重新学?写作能力、编程基本功、对某个行业的深度理解、一套你自己维护的创作系统,这些东西的改进可以持续十年以上。相比之下,某个工具的最佳配置、某次消费的最优选择,用完就没了。复利潜力的判断标准是:如果这个领域的改进是一件你可以做二十年的事,它可能有复利。如果它的保质期不超过两年,它大概率没有。

第二个维度是反馈质量。你做对还是做错,多快能知道?信号强度够不够排除运气?如果你做一个产品,用户反馈在几天内就能告诉你方向对不对,这是高质量反馈。如果你做健康管理,体重、睡眠、血液指标在周级别就能反映变化,这也是可用的反馈。如果你做投资,你根本无法在一年以内区分能力和运气,这就是低质量反馈。反馈质量决定了你能不能在合理的时间内从错误中学到东西。如果学不到,你只是在随机游走。

第三个维度是你的比较优势。这一点最难诚实评估。大多数聪明人对自己在每个领域的比较优势都高估了。觉得自己比平均水平聪明,所以研究一下就能超过默认方案。但默认方案本身就是由大量聪明人共同迭代出来的。标普 500 的定价里包含了所有市场参与者的判断,Claude Code 的默认行为里包含了模型团队和海量用户的反馈。你一上来就觉得能超过它,从概率上说不太对。

一个可操作的评估方法:看历史记录,不要靠感受。你过去在这个领域做的优化,有没有产生过可验证的、持续的正收益?如果有,记录在哪儿?如果没有记录,或者记录显示收益不明显,你的比较优势大概率不存在。

三个维度都满足的领域:复利潜力高、反馈质量好、你确实有比较优势。这种领域就是你的 active alpha zone,数量应该限制在一到两个。

只满足一两个维度的领域:比如复利高但反馈差(健康管理、投资),或者反馈好但复利低(日常工具选择)。这些属于灰色地带。处理方式是给它们分配有限的 alpha 预算,而不是随时可以进场。比如健康管理可以用代理指标把反馈提前:关注体重趋势而非每天的感觉。投资可以用资产配置代替选股,把 alpha 问题转换成 beta 问题。

三个维度都不满足的领域:果断 beta。挑一个默认方案,停下来。

最难的地方:看到不等于应该做

这个框架不难理解,但在执行层面有一个深层障碍。聪明人之所以在每个领域都追 alpha,恰好因为他们确实看得到改进空间。

你看一眼某个工具,马上就知道哪里可以配置得更合理。你看一眼某个流程,马上就知道哪里可以省一步。这种能力不是幻觉,它真实存在。问题在于:能看到的改进空间,不等于值得填的改进空间。

因为看到改进空间只说明了你在这个领域的相对感知能力,它什么都没说明这个改进本身的价值大小。你能看到酒店价格有 8% 的优化空间,不代表你花三十分钟去省这 8% 是划算的。你能看到 prompt 有优化空间,不代表你今天优化的东西三个月后还在。

这个误区有一个简单但有效的检验方法:把改进用时间价值换算一下。如果你每小时的时间值 X 元,优化这件事能省下的金额或节省的时间,乘以你预期这个改进能持续的年数,如果算下来连你自己时薪的一半都不到,那它不应该进入你的 alpha zone。它未必不成立,但它的代价是把注意力从更好的去处抽走了。

另一个检验方法是问:这个改进能不能迁移?你花时间优化的这个 prompt 模板,能不能用于其他场景?你研究的这个信用卡策略,能不能帮你理解财务系统的运作?如果答案是不能,它就是一锤子买卖。一锤子买卖不配叫 alpha。

把 Beta 选好,本身是需要判断力的

还有一个经常被忽略的点:选 beta 不是随便选,它也需要判断力。只是这个判断力用在了选轨道上,而不是用在了轨道内的跑步姿势上。

好的 beta 有几个特征。第一,它背后的系统有强竞争在推动进化。AI 编程工具现在有四五个大玩家在互相卷,你挂上任何一个主流工具都能吃到竞争红利。第二,它的升级会自动进入你的工作流,不需要你重新学习或迁移。第三,切换成本低。如果这个系统有一天变差了,你能无痛换到另一个。

反过来,差的 beta 是那些看起来稳定但其实在萎缩的系统,或者是那些升级需要你不断重新适应的系统。

所以 beta 的选题能力,本质上是对趋势的判断力。你在判断哪个系统会长期向上,而不是在判断系统内部的哪个参数最优。这也是为什么陈然说「等着 CC 或 Codex 升级」不是一个消极行为,它是一个积极的 beta 选择。

结论

回到陈然的那段话。他说的「只在极少的地方追求 alpha」,这句话的难度不在于「少」,而在于你需要在每个领域都做一次判断,然后把大部分结果判成 beta。

这个判断有三个支柱:复利潜力和反馈质量决定这个领域值不值得你进去,比较优势决定你进去之后能不能赢。三个支柱都站住的领域,可能只有一两个。剩下的,挑一个好的 beta 挂上去,然后把省出来的注意力全部投进那仅有的几个 alpha zone。

这不是偷懒。这是资源配置。

鸭哥每日手记

日更的深度AI新闻和分析