科研与技术前沿产业与竞争

太空数据中心的散热问题:一个数量级分析

Elon Musk 说太空数据中心 2-3 年内会成为最便宜的 AI 算力来源。Jeff Bezos 保守一些,说 10-20 年。Google 的 Project Suncatcher 计划 2027 年往太空送 TPU。初创公司 Starcloud 已经在 2025 年底用一块 H100 完成了在轨 AI 训练。

他们的核心论点是:太空有无限太阳能,不需要跟电网抢电、跟农业抢水。听起来合理。但这个论点跳过了一个前提:电变成算力的过程中,几乎 100% 的电能最终转化为热量。地面上散热靠空气和水,太空中没有这两样东西。太空中唯一的散热方式是热辐射,物体通过向外发射红外线把能量慢慢送走。

这到底有多慢?不需要从公式推导,直接看人类在太空中最大的工程项目就行。

ISS 告诉我们的事

国际空间站(ISS)总质量 470 吨,耗时二十多年组装,是人类建造过的最大太空结构。它的散热系统由 NASA 数十年经验打造,用液态氨在管路中循环,把舱内的热量搬运到外部散热板,再由散热板向太空辐射出去。NASA 的技术文档给出的参数:

126 kW 大约相当于一栋中型写字楼的空调负荷。一个中型地面数据中心的发热量是 10 MW,ISS 散热能力的 80 倍。Musk 描绘的大型 AI 数据中心在 100 MW 到 1 GW,是 ISS 的 800 到 8000 倍。

ISS 为了这 126 kW 的散热,动用了 645 平方米、近 10 吨的散热板,加上两个各重 420 公斤的旋转关节机构和整套液态氨循环系统。这套系统在二十多年服役期间反复出现氨泄漏。NASA 记录了多次紧急舱外维修,其中 2013 年的一次泄漏最终追溯到密封件在轨道热循环中反复冻融导致的镀层剥离。人类在太空热管理方面的最高工程水平,处理的是一栋写字楼级别的热量。

从 ISS 到数据中心:数字是什么样的

ISS 的散热板在近地轨道环境下,每平方米大约散掉 130-200 W 的热量。这个数字受物理学限制:在电子设备正常工作温度(约 27°C)下,辐射散热的效率就在每平方米几百瓦这个量级。地面数据中心用空气和水对流散热,每平方米可以搬运几千到几万瓦,差一到两个数量级。

一个自然的反应是:能不能让芯片在更高温度下工作?辐射功率和温度的四次方成正比,温度越高散热越快。但提升幅度比直觉中小得多。把工作温度从 27°C 提高到 90°C(从 300K 到 363K),辐射散热功率只增加约 2.1 倍,从 400 W/m² 涨到 860 W/m²。面积需求缩小不到一半,数量级没有变。要把面积缩小 10 倍以上,工作温度得提高到 500K 以上(230°C 以上),目前没有任何数据中心级别的计算芯片能在这个温度下运行。

按 ISS 的实际参数做线性外推:

散热需求 散热板面积 直觉参照 散热板重量 Starship 发射次数
10 MW(中型数据中心) 50,000 m² 7 个足球场 700 吨 7 次
100 MW(大型 AI 数据中心) 500,000 m² 70 个足球场 7,000 吨 70 次
1 GW(Musk 级愿景) 5,000,000 m² 700 个足球场 70,000 吨 700 次

100 MW 数据中心仅散热板就需要 7,000 吨,相当于 15 个完整的国际空间站。Starcloud 自己也算过类似的数字:他们的远期 5 GW 愿景中,太阳能加散热面板的总面积约 4 公里 x 4 公里

发射成本再低,要送上去的东西的总量不变。

太阳能的矛盾

支持者反复说 “It’s always sunny in space”。太阳能确实是太空数据中心最有说服力的优势。但同一个太阳对散热系统来说是最大的麻烦。

太阳在地球轨道附近的辐射强度约 1360 W/m²。一块散热板正面朝着太阳时,即使涂了目前最好的反射涂层,每平方米仍然会吸收约 200 W 的太阳热量。而这块板子在正常温度下的辐射散热能力总共约 400 W/m²。正面对阳,净散热能力直接减半。涂层老化后(ISS 上已经观测到这个现象),散热板可能变成净吸热面。

ISS 的解决方案是让散热板始终侧面对着太阳,把面向太阳的投影面积压到接近零。NASA 为此设计了 Thermal Radiator Rotary Joint(TRRJ),一个专用旋转机构,通过算法控制散热板在日照段保持侧面朝阳,阴影段再转过来面对深空。每个 TRRJ 重 420 公斤,ISS 需要两个。

这个约束和近地轨道无关。1986 年 NASA 的空间站设计论文就已经把”散热板始终侧面对阳”写进基础配置要求。只要散热器在太阳照得到的地方,就必须管理这个矛盾:太阳能面板需要正面对着太阳,散热板需要侧面对着太阳,两者的朝向需求冲突。

不同轨道的情况确实有差异。NASA 的热环境数据显示,近地轨道(LEO)最复杂,因为 90 分钟经历一次昼夜交替,地球本身还会反射太阳光和发射红外辐射,给散热板额外加热。地球同步轨道(GEO)好一些。日-地拉格朗日 L2 点的环境最优:太阳、地球、月球始终在同一侧,可以用一面固定遮阳板永久遮挡,散热面始终朝着 -270°C 的深空。JWST 的五层遮阳板就是这么工作的,200 kW 的太阳辐射只有 23 毫瓦透过冷端

但 L2 对数据中心有另外两个问题。第一,它离地球 150 万公里,通信单程延迟约 5 秒,完全脱离地球的补给和维护体系。对需要和地面用户实时交互的数据中心来说,这个延迟和运维距离可能比散热问题更致命。第二,L2 是一个不稳定平衡点,航天器需要持续消耗推进剂做轨道维持(大约每 23 天一次修正)。目前只有 JWST、Gaia、Euclid 等少数科学卫星在 L2 附近运行。L2 的物理空间本身倒不拥挤(halo 轨道覆盖的区域在每个维度上有几十万公里),但 150 万公里外的持续补给和维护是一个比近地轨道困难得多的后勤问题。

前沿技术能帮多少忙?

上面的计算用的是 ISS 现有技术参数。航天工程几十年来一直在研究更好的太空散热方案。

NASA 当前投入最大的项目是 MARVL(为核电推进系统设计的模块化散热器),目标是把散热板的面密度从 ISS 的 14 kg/m² 降到 3.5 kg/m²,同时在更高的温度(450-550K)下运行。温度越高辐射散热效率越高,翻一倍温度散热能力涨 16 倍。但这需要计算芯片能在 175°C 以上工作,目前的 GPU 和 TPU 做不到。MARVL 2024 年 8 月才首次公开报告,技术成熟度在 TRL 3-4。

另一条路叫液滴辐射器(Liquid Droplet Radiator):把低蒸气压液体喷成雾状,在太空中飘过一段距离辐射散热,然后回收。NASA 在 1980 年代做过地面验证,理论上比固体散热器轻约 10 倍。但它从未上过太空,自 1990 年代起研究停滞了近 30 年。零重力下回收液滴、防止液滴污染航天器光学表面等问题至今没有工程方案。

把所有在研技术的最乐观数字叠加在一起(散热板轻 4 倍、高温运行效率高 5 倍),系统级的总改进大约在一个数量级,10-20 倍。100 MW 数据中心的散热板从 70 个足球场缩小到 3-7 个足球场,从 7,000 吨减到 350-700 吨。

即使在最乐观的技术假设下,100 MW 级别的太空数据中心仍然需要发射数百吨专用散热设备,占据数个足球场面积。而这些假设每一条都依赖尚未完成太空验证的技术,且需要计算硬件能承受远超当前极限的工作温度。

工程差距和物理差距

太空数据中心面临的问题分两类。一类是工程差距:发射成本、通信带宽、辐射防护。这些有明确的改进方向。Starship 的目标是把发射成本从 $3,600/kg 降到 $200/kg 以下,Starlink V3 计划单星达到 1 Tbps 下行,辐射容忍芯片也在逐代追赶商用性能。工程差距靠钱和时间可以逐步收窄。

散热属于物理差距。辐射散热的效率上限由热力学定律决定,在电子设备能承受的温度范围内,每平方米的辐射散热就在几百瓦这个量级。前沿技术的改进路径主要靠提高工作温度(让散热效率随温度四次方增长),但这需要计算硬件的耐温能力发生根本性变化。这类差距不随工程投入线性改善。

Varda Space Industries 的 Andrew McCalip 算过一笔总账:1 GW 轨道数据中心约 $42.4B,同等地面设施约 $15.9B。他在 TechCrunch 的采访中说:

“The economics are not close. This is not a 25% mismatch. It’s 400%. Closing that is the whole job.”

有 NASA 和 Google 双重背景的辐射电子学博士 Sarah Thompson 在她的分析中判断这是给投资人看的烟雾弹(smoke and mirrors investor bait)。Breakthrough Institute 的分析标题直接写”数据中心短期内不会进入太空”(Data Centers Won’t Be In Space Anytime Soon)。Voyager Technologies CEO Dylan Taylor 在 CNBC 采访中说散热问题违反直觉(counterintuitive)但尚未解决。

另一面是真金白银。Starcloud 拿到 1,340 万美元融资(NFX 领投,a16z 和 Sequoia scout fund 参与),完成了在轨 GPU 演示。Google 的 Project Suncatcher 被 Sundar Pichai 列为与自动驾驶、量子计算并列的 moonshot 项目。行业报告预计在轨数据中心市场到 2035 年达 $39B。

从现有证据看,Musk 的”2-3 年”和 Bezos 的”10-20 年”之间的分歧,对应的是对散热问题性质的不同判断。如果把散热当作工程问题,Starship 降本加一些散热板优化就能搞定,乐观几年、保守十几年。如果认识到这是物理约束,需要散热技术一个数量级的突破加上计算硬件耐温能力的根本提升,二十年可能都不够。

下次有人说太空数据中心”只差发射成本降下来”,追问一个问题就行:散热怎么办?从 ISS 的 126 kW 到数据中心的 10 MW 乃至 1 GW,中间隔着两到四个数量级。物理定律不接受融资。

来源索引

ISS 散热系统数据 - NASA ATCS Overview — EATCS/PVTCS 设计参数、TRRJ 规格、RGAC 算法 - NASA TFAWS 2014 热环境 — LEO/GEO 环境热负荷数据 - NASA NTRS 20220003097 — P1 EATCS 氨泄漏全过程与 root cause analysis - Spacecraft Thermal Control Handbook Ch.6 — 散热器设计参数范围 100-350 W/m² - Project Rho 散热器汇总 — ISS 散热板面密度数据

前沿散热技术 - NASA MARVL 报告 — 模块化展开散热器,3.5 kg/m² 目标 - NASA MARVL 2025 更新 — LaRC 团队最新进展 - NASA LDR 1987 实验 — 液滴辐射器地面真空验证 - NASA LDR 1985 分析 — LDR 比固体散热器轻约 10 倍

太空数据中心叙事与批评 - AP News — Musk 太空 AI 公告 - Google Project Suncatcher - GeekWire — Bezos 10-20 年时间线 - Starcloud 在轨 GPU 演示 - Starcloud 白皮书 — 含 4km x 4km 面板面积估算 - McCalip 成本计算器 — 1 GW 轨道 vs 地面成本对比 - TechCrunch 经济分析 - Ars Technica 系列分析 - Sarah Thompson 技术批评 - Breakthrough Institute 分析 - TechBuzz — Dylan Taylor 采访 - SatNews 散热物理墙 - JWST 遮阳板 — 200 kW 太阳辐射降至 23 mW 透过 - Starlink V3 参数 — 单星 1 Tbps 下行

鸭哥每日手记

日更的深度AI新闻和分析