产业与竞争推理与性能

AI 正在让每一台电子设备变贵

发布于 2026 年 6 月 26 日

买个大模型会员、付点 API 账单、租台高配服务器，这大概是大家平时能想到的 AI 成本。但其实，当你准备买下一台笔记本电脑时，价格标签里已经悄悄塞进了一笔你没注意到的 AI 账单。

2026 年 6 月 25 日，苹果决定把自家的硬件产品价格上调 15% 到 25%，这意味着买一台设备最高得多花 300 美元。面对内存不够用的情况，库克甚至公开用“百年一遇的洪灾”来形容这番处境（NYT，Bloomberg）。随后，戴尔、惠普和联想也跟着涨了价。大家可能觉得这是因为关税或者物流出了问题，但真正的幕后推手，是三星、SK 海力士和美光这三家巨头的排产计划。这三家大厂垄断了全球九成以上的高端内存产能，在刚过去的一个财季里，他们的利润高得惊人，甚至用 84.9% 的毛利率把台积电甩在后面。

在这场产能争夺战里，不差钱的 AI 数据中心抢走了最优先的供货位置，普通数码设备的生产只能往后排。买一台 16GB 统一内存的 MacBook 让你多掏的 300 美元，根源就在于内存大厂把晶圆优先留给了出价更高的 AI 客户，苹果自己反倒没拿这部分利润。这种连锁反应不会直接出现在你的大模型订阅账单上，却会实打实地分摊到你买的每一件电子产品里。

同一块晶圆，两个不同的去处

苹果、戴尔这些厂商之所以要涨价，说到底就是因为市场上能买到的内存颗粒太少了。

把两类硬件对比一下，就知道问题出在哪里了。一台轻薄本需要 16GB 的统一内存，而一块 H200 加速卡则需要高达 141GB 的高带宽内存（HBM）。这两样东西用的都是同一种 DRAM 晶圆，但 HBM 用的是多层芯片垂直堆叠工艺。这导致做 1GB 的 HBM 所消耗的晶圆面积，足够生产 3 到 4GB 的普通内存（Wikipedia）。所以，当大厂把晶圆送去封装 HBM 时，能留给笔记本电脑做 LPDDR5 内存的材料就变少了。AI 客户多吃掉一块原料，普通消费级硬件的供应就得少一块。

说到底，利润在驱动着一切。HBM 的毛利率早就超过了 50%，而普通内存的长期利润一般只有 10% 到 30%。虽然内存厂的设备其实可以切换生产这两种芯片（SemiWiki），但显然没有哪家公司会主动放着高利润的买卖不做，跑去生产低回报的产品。既然总产能就那么多，把稀缺的芯片卖给预算最充足的客户，完全符合商业逻辑。

2022 年与 2026 年全球内存采购份额对比：服务器中心从 25% 飙升到 70%，个人消费电子端则从 75% 缩水到 30%

只用了二十来个月，云端服务器就从一个普通买家，一跃成为了吃掉全球七成内存产能的最大客户。在 2022 年，服务器用掉的内存只占全球产出的 20% 到 30%，但到了 2026 年，这个比例已经冲到了 70% 左右（Tech Insider）。普通电脑和手机的内存需求并没有凭空消失，它们只是在那些出手阔绰的 AI 买家面前，彻底失去了竞争供货优先级的资格。

84.9%：比芯片代工一哥还要赚钱

手机和电脑价格上调 15%，很多人可能会觉得，这不就是因为供应链缺材料吗？但按照平常的商业逻辑，供应紧张一般意味着整条产业链一起分摊成本，供货商赚点微薄的辛苦钱，买家多出点溢价。然而，现在的内存市场却完全不是这么回事。

三家内存大厂毛利率与台积电对比：美光达到 84.9%，SK 海力士达到 72%，三星 66%，而台积电在 60% 左右

美光在最近的财报里说，他们的毛利率已经飙到了 84.9%，而在一年前的同一时期，这个数字还只有 39%（Investing.com）。同时，三星内存部门的利润率也达到了 66%，SK 海力士则是 72%。这三家大厂的赚钱能力，全都超过了台积电 60% 左右的长期毛利率（Tom’s Hardware）。要知道，内存以前一直是被当作周期性大宗商品来看待的，如今它们的吸金效率却把行业最顶尖的芯片代工巨头给比了下去。

将近 85% 的毛利率意味着，公司每卖出 1 块钱的产品，直接成本还不到一毛五分钱。如果涨价只是为了应付原材料和设备成本的增加，这几家公司的利润率绝对不可能翻倍。利润率的暴涨，说明产品的售价和实际的生产成本之间已经拉开了极大的差距。这么高的利润率也证明了一件事，那就是这几家大厂正在利用手中的定价权，把价格定得远超生产成本，而不仅仅是被动地应对成本上涨。

这套强大的定价权，来自极高的行业集中度。三星、SK 海力士和美光这三家大厂，联手垄断了全球九成以上的 DRAM 份额。这是过去几十年里，用无数资金和技术积累建起来的防火墙。对于 AI 客户来说，HBM 是建算力中心必不可少的战略物资，所以哪怕价格再涨，他们也必须买，采购量根本不会受涨价影响。处于垄断地位的内存厂也自然顺应了资本逐利的天性，把产能天平倾斜给了给钱更多的 AI 客户。

美光透露，他们已经和核心大客户签了 16 份跨年度的长期协议，其中有 14 份协议直接锁定了总共约 1000 亿美元的确定性收入。这些买家为了在紧张的产能中抢到配额，已经提前支付了近 220 亿美元的信贷和资金担保，其中包括 180 亿美元的真金白银预付款，以及 40 亿美元的信用证（证券时报）。像这样提前几年锁定工厂产能、还交了这么多定金的做法，在内存行业历史上可以说是非常少见。既然 AI 客户愿意为了确保设备能按时到货而承受远高于均价的采购成本，拥有高度垄断地位的内存大厂自然优先满足这些超级买家。结果就是，买普通电脑和手机的厂商只能被排在等待名单的最后面。

我们买电脑手机时遇到的涨价，本质上就是在内存不够用时，三巨头把大批生产线配额留给 AI 客户的直接结果。普通消费者结账时多掏的那些钱，实际上是我们在替这套分配机制买单。

消费电子市场遇冷，但大厂做出了选择

眼看着内存价格节节攀升，普通消费者这边已经开始有人离场了。

2026 年，全球智能手机出货量同比缩水了 13.9%，个人电脑出货也下滑了 11.3%，双双创下历史新低（IDC）。面对一路上涨的价格，大家也各有对策：要么让手里的老电脑手机再撑两年，要么退而求其次买个基础款，要么干脆不换了。虽然手机的平均售价冲到了创纪录的 550 美元，但总出货量却在急剧缩水，这让许多主打中低端市场的厂商日子非常难过（Tech Insider）。

这种供需上的不对等，暴露出两边抗风险能力的巨大差距。普通人对数码产品的价格非常敏感，一旦贵过心理底线，说不买就不买了。相反，科技巨头买 HBM 时基本不怎么看短期溢价。毕竟算力中心是绝对的刚需，工程一旦开工，根本不可能因为内存涨价就中途停工。对于手握晶圆的内存厂来说，把同样的材料深加工卖给 AI 大户，不仅利润高得多，订单还特别稳。要是在消费电子市场上投放原料，不仅卖不上好价钱，还要承担随时可能被取消订单的风险。

两边需求的不对等，直接拉开了一条清晰的分水岭。普通消费者选择等等再买，根本动摇不了上游芯片厂的排产计划。各大 AI 开发商的采购合约早就签到了 2027 到 2028 年，巨额定金也已经提前到账。所以，哪怕普通终端市场少卖了几十万台电脑手机，这点毛毛雨根本影响不了三星这些巨头的工厂规划。这就是残酷的现实：出得起高价的客户直接决定了资源的流向，预算不够的普通买家，要么只能捡剩下的边角料，要么只能彻底出局。普通消费者的需求波动，在最源头的排产阶段就已经被大厂自动过滤掉了。

什么时候能降价：看看供需两边给出的信号

这场全方位的涨价到底什么时候能迎来拐点？现在市场上正并存着两种截然不同、但听起来都挺有道理的分析。

认为‘缺货一时半会儿好不了’的一方指出，HBM 占 DRAM 晶圆的消耗比例已经从 2025 年的 19% 升到了 2026 年的 23%，分析师甚至预测后续可能冲上 35%（EnkiAI）。三家内存巨头在 2026 年的 HBM 产能早就卖光了，很多大单甚至直接排到了 2027 到 2028 年。美光 CEO 梅赫罗特拉在最近的业绩会上也说，AI 浪潮才刚刚开始。他提供了一个参考数据：一台智能人形机器人所需的内存容量，足足是主流 L2+ 智能车内存的 10 倍（Investing.com）。一旦这些硬件开始规模化量产，全社会对内存的需求还会迎来更夸张的暴涨。行业机构 IDC 直接把眼下的情况定义为‘产能的系统性再分配’，这可不是什么短暂的供需波动（IDC）。与此同时，三星和 SK 海力士也放出了类似的风声，觉得这次内存不够用的情况至少会持续到 2027 年，有些压力甚至要到 2030 年才能慢慢缓解（TechPowerUp）。

不过，觉得‘周期终究会起作用，价格总会跌下来’的论据同样站得住脚。在过去 70 年的发展中，半导体行业经历过 15 次以上的下行考验，普通的 DRAM 价格循环通常也就是 3 到 5 年，至今还没人能打破这个规律（Fabricated Knowledge，UncoverAlpha）。眼下，三家内存大厂都在拼命扩大产能。比如三星计划在 2026 年扩产 50%，SK 海力士的总投资超过了 300 亿美元，美光全年的资本开支也锁定在了 200 亿美元左右。这些正在建的新产线，预计会在 2027 到 2028 年迎来产能的集中爆发。这很像 2021 到 2022 年发生在全球的电池级锂料紧缺，当时新能源车爆发，把原料价格拉高了五倍，直接导致各种电池材料缺货。但过了不到三年，随着上游开采和加工跟上，原料价格就开启了明显的下行走势（ICCT）。另外，下游在优化算法、降低内存占用这块也在发力。比如谷歌研发的 TurboQuant 压缩算法，据说能让大模型的内存占用降到原本的六分之一（Traderverse）。这种上游疯狂扩产、下游拼命省料的组合拳，正是历史上历次缺货周期的经典终结方式。

2018 年至 2028 年 DRAM 售价周期：AI 推高了芯片价格的长期底线，但随着产能释放，价格高点终究会回落

对比两边的观点，内存价格大概率会在 2027 到 2028 年开始回落。不过，这并不意味着它能重新跌回 2024 年的低谷。AI 对 HBM 的刚性消耗，等于给芯片价格直接垫高了一层台阶。这样一来，市面上各种电子产品的‘丐版’配置，比如 8GB 统一内存的电脑、或者 128GB 的手机，在货架上的寿命可能会被明显拉长。随着新工厂陆续完工、各种模型压缩技术越来越普及，内存成本总会降下来一些，只是最终跌落的底线会比以前高得多。

搞技术的和开发者，我们该怎么应对？

对我们这些平时写代码、做模型微调的技术人来说，内存和显卡涨价根本不需要看什么宏观分析报告，看看自己结账时的账单就一清二楚了。

现在 DDR5 内存价格已经累计涨到了之前的四倍。同时，RTX 5090 显卡的现货价格也已经溢价了 65%。云服务这块，那些内存密集型的云服务器主机价格也预计要上涨 10% 到 15%（Bloomberg）。如果你现在打算自己组装一台 x86 开发机，稍微配得好一点，买内存的钱可能比买显卡的钱还要贵。

在当前的硬件行情下，出现了一个挺反直觉的事。苹果 M 系列芯片用的统一内存架构，在这波涨价大潮里，反而显现出了极强的防御力。因为 M 系列处理器让 CPU 和 GPU 共享同一块物理内存，巧妙地避开了购买高溢价独立显存和外置 DDR5 的高昂成本。当传统的 x86 开发机因为内存暴涨四倍而导致成本直线飙升时，升级 Mac 统一内存的开销反而显得比以前温和了。这让大家在配置本地开发机时的逻辑发生了微妙的转变：苹果电脑现在的优势，反倒不再是单纯的芯片跑分，而是性价比更高的统一内存容量。

还有一条更隐蔽的传导链条，正在云端服务器里悄悄发生。HBM 的价格暴涨，会直接拉高 GPU 的采购成本，进而转嫁到云主机的租金上。这不可避免地抬高了大模型厂商的单次计算成本。面对这种情况，厂商只有两条出路：要么直接上调 API 接口的收费，要么悄悄给服务的响应质量缩水。而后一种做法在实际工程中往往体现为：合批处理更激进、缩短大模型支持的上下文长度，或者限制得更死。所以哪怕你做本地业务不需要买任何一块实体芯片，内存不够用最终也会变成更贵、更不稳定的 API 接口，实打实地影响到你的项目。

看未来两到三年，在设计技术路线和规划硬件时，最好把‘内存成本长期居高’当成一个默认的基础条件。在 2026 到 2027 年的这波价格高点上，尽量别去直接签长期的固定高价供货合同。就算从长周期来看，供需关系终究会把价格拉回正常水平，但我们千万别天真地觉得价格能重新跌回 2024 年的低位。AI 计算对整个内存生产线的重塑，已经把底层的制造和采购成本推上了一个新台阶。不管以后市场怎么波动，以前那种白菜价的内存，注定已经成为历史了。