产业与竞争推理与性能

AI 正在让每一台电子设备变贵

买个大模型会员、付点 API 账单、租台高配服务器,这大概是大家平时能想到的 AI 成本。但其实,当你准备买下一台笔记本电脑时,价格标签里已经悄悄塞进了一笔你没注意到的 AI 账单。

2026 年 6 月 25 日,苹果决定把自家的硬件产品价格上调 15% 到 25%,这意味着买一台设备最高得多花 300 美元。面对内存不够用的情况,库克甚至公开用“百年一遇的洪灾”来形容这番处境(NYTBloomberg)。随后,戴尔、惠普和联想也跟着涨了价。大家可能觉得这是因为关税或者物流出了问题,但真正的幕后推手,是三星、SK 海力士和美光这三家巨头的排产计划。这三家大厂垄断了全球九成以上的高端内存产能,在刚过去的一个财季里,他们的利润高得惊人,甚至用 84.9% 的毛利率把台积电甩在后面。

在这场产能争夺战里,不差钱的 AI 数据中心抢走了最优先的供货位置,普通数码设备的生产只能往后排。买一台 16GB 统一内存的 MacBook 让你多掏的 300 美元,根源就在于内存大厂把晶圆优先留给了出价更高的 AI 客户,苹果自己反倒没拿这部分利润。这种连锁反应不会直接出现在你的大模型订阅账单上,却会实打实地分摊到你买的每一件电子产品里。

同一块晶圆,两个不同的去处

苹果、戴尔这些厂商之所以要涨价,说到底就是因为市场上能买到的内存颗粒太少了。

把两类硬件对比一下,就知道问题出在哪里了。一台轻薄本需要 16GB 的统一内存,而一块 H200 加速卡则需要高达 141GB 的高带宽内存(HBM)。这两样东西用的都是同一种 DRAM 晶圆,但 HBM 用的是多层芯片垂直堆叠工艺。这导致做 1GB 的 HBM 所消耗的晶圆面积,足够生产 3 到 4GB 的普通内存(Wikipedia)。所以,当大厂把晶圆送去封装 HBM 时,能留给笔记本电脑做 LPDDR5 内存的材料就变少了。AI 客户多吃掉一块原料,普通消费级硬件的供应就得少一块。

说到底,利润在驱动着一切。HBM 的毛利率早就超过了 50%,而普通内存的长期利润一般只有 10% 到 30%。虽然内存厂的设备其实可以切换生产这两种芯片(SemiWiki),但显然没有哪家公司会主动放着高利润的买卖不做,跑去生产低回报的产品。既然总产能就那么多,把稀缺的芯片卖给预算最充足的客户,完全符合商业逻辑。

2022 年与 2026 年全球内存采购份额对比:服务器中心从 25% 飙升到 70%,个人消费电子端则从 75% 缩水到 30%

只用了二十来个月,云端服务器就从一个普通买家,一跃成为了吃掉全球七成内存产能的最大客户。在 2022 年,服务器用掉的内存只占全球产出的 20% 到 30%,但到了 2026 年,这个比例已经冲到了 70% 左右(Tech Insider)。普通电脑和手机的内存需求并没有凭空消失,它们只是在那些出手阔绰的 AI 买家面前,彻底失去了竞争供货优先级的资格。

84.9%:比芯片代工一哥还要赚钱

手机和电脑价格上调 15%,很多人可能会觉得,这不就是因为供应链缺材料吗?但按照平常的商业逻辑,供应紧张一般意味着整条产业链一起分摊成本,供货商赚点微薄的辛苦钱,买家多出点溢价。然而,现在的内存市场却完全不是这么回事。

三家内存大厂毛利率与台积电对比:美光达到 84.9%,SK 海力士达到 72%,三星 66%,而台积电在 60% 左右

美光在最近的财报里说,他们的毛利率已经飙到了 84.9%,而在一年前的同一时期,这个数字还只有 39%(Investing.com)。同时,三星内存部门的利润率也达到了 66%,SK 海力士则是 72%。这三家大厂的赚钱能力,全都超过了台积电 60% 左右的长期毛利率(Tom’s Hardware)。要知道,内存以前一直是被当作周期性大宗商品来看待的,如今它们的吸金效率却把行业最顶尖的芯片代工巨头给比了下去。

将近 85% 的毛利率意味着,公司每卖出 1 块钱的产品,直接成本还不到一毛五分钱。如果涨价只是为了应付原材料和设备成本的增加,这几家公司的利润率绝对不可能翻倍。利润率的暴涨,说明产品的售价和实际的生产成本之间已经拉开了极大的差距。这么高的利润率也证明了一件事,那就是这几家大厂正在利用手中的定价权,把价格定得远超生产成本,而不仅仅是被动地应对成本上涨。

这套强大的定价权,来自极高的行业集中度。三星、SK 海力士和美光这三家大厂,联手垄断了全球九成以上的 DRAM 份额。这是过去几十年里,用无数资金和技术积累建起来的防火墙。对于 AI 客户来说,HBM 是建算力中心必不可少的战略物资,所以哪怕价格再涨,他们也必须买,采购量根本不会受涨价影响。处于垄断地位的内存厂也自然顺应了资本逐利的天性,把产能天平倾斜给了给钱更多的 AI 客户。

美光透露,他们已经和核心大客户签了 16 份跨年度的长期协议,其中有 14 份协议直接锁定了总共约 1000 亿美元的确定性收入。这些买家为了在紧张的产能中抢到配额,已经提前支付了近 220 亿美元的信贷和资金担保,其中包括 180 亿美元的真金白银预付款,以及 40 亿美元的信用证(证券时报)。像这样提前几年锁定工厂产能、还交了这么多定金的做法,在内存行业历史上可以说是非常少见。既然 AI 客户愿意为了确保设备能按时到货而承受远高于均价的采购成本,拥有高度垄断地位的内存大厂自然优先满足这些超级买家。结果就是,买普通电脑和手机的厂商只能被排在等待名单的最后面。

我们买电脑手机时遇到的涨价,本质上就是在内存不够用时,三巨头把大批生产线配额留给 AI 客户的直接结果。普通消费者结账时多掏的那些钱,实际上是我们在替这套分配机制买单。

消费电子市场遇冷,但大厂做出了选择

眼看着内存价格节节攀升,普通消费者这边已经开始有人离场了。

2026 年,全球智能手机出货量同比缩水了 13.9%,个人电脑出货也下滑了 11.3%,双双创下历史新低(IDC)。面对一路上涨的价格,大家也各有对策:要么让手里的老电脑手机再撑两年,要么退而求其次买个基础款,要么干脆不换了。虽然手机的平均售价冲到了创纪录的 550 美元,但总出货量却在急剧缩水,这让许多主打中低端市场的厂商日子非常难过(Tech Insider)。

这种供需上的不对等,暴露出两边抗风险能力的巨大差距。普通人对数码产品的价格非常敏感,一旦贵过心理底线,说不买就不买了。相反,科技巨头买 HBM 时基本不怎么看短期溢价。毕竟算力中心是绝对的刚需,工程一旦开工,根本不可能因为内存涨价就中途停工。对于手握晶圆的内存厂来说,把同样的材料深加工卖给 AI 大户,不仅利润高得多,订单还特别稳。要是在消费电子市场上投放原料,不仅卖不上好价钱,还要承担随时可能被取消订单的风险。

两边需求的不对等,直接拉开了一条清晰的分水岭。普通消费者选择等等再买,根本动摇不了上游芯片厂的排产计划。各大 AI 开发商的采购合约早就签到了 2027 到 2028 年,巨额定金也已经提前到账。所以,哪怕普通终端市场少卖了几十万台电脑手机,这点毛毛雨根本影响不了三星这些巨头的工厂规划。这就是残酷的现实:出得起高价的客户直接决定了资源的流向,预算不够的普通买家,要么只能捡剩下的边角料,要么只能彻底出局。普通消费者的需求波动,在最源头的排产阶段就已经被大厂自动过滤掉了。

什么时候能降价:看看供需两边给出的信号

这场全方位的涨价到底什么时候能迎来拐点?现在市场上正并存着两种截然不同、但听起来都挺有道理的分析。

认为‘缺货一时半会儿好不了’的一方指出,HBM 占 DRAM 晶圆的消耗比例已经从 2025 年的 19% 升到了 2026 年的 23%,分析师甚至预测后续可能冲上 35%(EnkiAI)。三家内存巨头在 2026 年的 HBM 产能早就卖光了,很多大单甚至直接排到了 2027 到 2028 年。美光 CEO 梅赫罗特拉在最近的业绩会上也说,AI 浪潮才刚刚开始。他提供了一个参考数据:一台智能人形机器人所需的内存容量,足足是主流 L2+ 智能车内存的 10 倍(Investing.com)。一旦这些硬件开始规模化量产,全社会对内存的需求还会迎来更夸张的暴涨。行业机构 IDC 直接把眼下的情况定义为‘产能的系统性再分配’,这可不是什么短暂的供需波动(IDC)。与此同时,三星和 SK 海力士也放出了类似的风声,觉得这次内存不够用的情况至少会持续到 2027 年,有些压力甚至要到 2030 年才能慢慢缓解(TechPowerUp)。

不过,觉得‘周期终究会起作用,价格总会跌下来’的论据同样站得住脚。在过去 70 年的发展中,半导体行业经历过 15 次以上的下行考验,普通的 DRAM 价格循环通常也就是 3 到 5 年,至今还没人能打破这个规律(Fabricated KnowledgeUncoverAlpha)。眼下,三家内存大厂都在拼命扩大产能。比如三星计划在 2026 年扩产 50%,SK 海力士的总投资超过了 300 亿美元,美光全年的资本开支也锁定在了 200 亿美元左右。这些正在建的新产线,预计会在 2027 到 2028 年迎来产能的集中爆发。这很像 2021 到 2022 年发生在全球的电池级锂料紧缺,当时新能源车爆发,把原料价格拉高了五倍,直接导致各种电池材料缺货。但过了不到三年,随着上游开采和加工跟上,原料价格就开启了明显的下行走势(ICCT)。另外,下游在优化算法、降低内存占用这块也在发力。比如谷歌研发的 TurboQuant 压缩算法,据说能让大模型的内存占用降到原本的六分之一(Traderverse)。这种上游疯狂扩产、下游拼命省料的组合拳,正是历史上历次缺货周期的经典终结方式。

2018 年至 2028 年 DRAM 售价周期:AI 推高了芯片价格的长期底线,但随着产能释放,价格高点终究会回落

对比两边的观点,内存价格大概率会在 2027 到 2028 年开始回落。不过,这并不意味着它能重新跌回 2024 年的低谷。AI 对 HBM 的刚性消耗,等于给芯片价格直接垫高了一层台阶。这样一来,市面上各种电子产品的‘丐版’配置,比如 8GB 统一内存的电脑、或者 128GB 的手机,在货架上的寿命可能会被明显拉长。随着新工厂陆续完工、各种模型压缩技术越来越普及,内存成本总会降下来一些,只是最终跌落的底线会比以前高得多。

搞技术的和开发者,我们该怎么应对?

对我们这些平时写代码、做模型微调的技术人来说,内存和显卡涨价根本不需要看什么宏观分析报告,看看自己结账时的账单就一清二楚了。

现在 DDR5 内存价格已经累计涨到了之前的四倍。同时,RTX 5090 显卡的现货价格也已经溢价了 65%。云服务这块,那些内存密集型的云服务器主机价格也预计要上涨 10% 到 15%(Bloomberg)。如果你现在打算自己组装一台 x86 开发机,稍微配得好一点,买内存的钱可能比买显卡的钱还要贵。

在当前的硬件行情下,出现了一个挺反直觉的事。苹果 M 系列芯片用的统一内存架构,在这波涨价大潮里,反而显现出了极强的防御力。因为 M 系列处理器让 CPU 和 GPU 共享同一块物理内存,巧妙地避开了购买高溢价独立显存和外置 DDR5 的高昂成本。当传统的 x86 开发机因为内存暴涨四倍而导致成本直线飙升时,升级 Mac 统一内存的开销反而显得比以前温和了。这让大家在配置本地开发机时的逻辑发生了微妙的转变:苹果电脑现在的优势,反倒不再是单纯的芯片跑分,而是性价比更高的统一内存容量。

还有一条更隐蔽的传导链条,正在云端服务器里悄悄发生。HBM 的价格暴涨,会直接拉高 GPU 的采购成本,进而转嫁到云主机的租金上。这不可避免地抬高了大模型厂商的单次计算成本。面对这种情况,厂商只有两条出路:要么直接上调 API 接口的收费,要么悄悄给服务的响应质量缩水。而后一种做法在实际工程中往往体现为:合批处理更激进、缩短大模型支持的上下文长度,或者限制得更死。所以哪怕你做本地业务不需要买任何一块实体芯片,内存不够用最终也会变成更贵、更不稳定的 API 接口,实打实地影响到你的项目。

看未来两到三年,在设计技术路线和规划硬件时,最好把‘内存成本长期居高’当成一个默认的基础条件。在 2026 到 2027 年的这波价格高点上,尽量别去直接签长期的固定高价供货合同。就算从长周期来看,供需关系终究会把价格拉回正常水平,但我们千万别天真地觉得价格能重新跌回 2024 年的低位。AI 计算对整个内存生产线的重塑,已经把底层的制造和采购成本推上了一个新台阶。不管以后市场怎么波动,以前那种白菜价的内存,注定已经成为历史了。

鸭哥每日手记

日更的深度AI新闻和分析