当算力饥渴遇上碳中和：2025-2026年AI基础设施的悖论与突围

9次阅读

共计 1843 个字符，预计需要花费 5 分钟才能阅读完成。

2025年，全球AI训练集群的单节点功耗已突破50kW，而2026年上半年，主流大模型厂商们纷纷公布的新一代预训练集群，单机柜功耗甚至飙升至100kW以上。这种算力军备竞赛带来的，是数据中心年耗电量以每年30%以上的速度递增。我在去年底参观了一个位于内蒙古的智算中心，运维总监指着PUE从1.4降到1.2的监控屏无奈地说：“我们把能用的液冷、余热回收都上了，但A100换到H200再到B200，每瓦性能提升远赶不上部署密度增长。”

这背后隐藏着一个尖锐的悖论：AI正在帮助人类解决气候预测、材料科学等碳中和难题，但其自身的能源消耗却成了新的碳排放大户——据国际能源署2025年报告，若按当前趋势发展，到2027年仅AI训练任务就将消耗全球3%的电力。这不是技术问题，而是基础设施的生存危机。

传统风冷在40kW/柜以上就已力不从心，而100kW/柜以上的场景，只有液冷能接住。2025年，阿里云在乌兰察布部署了国内首个大规模单相浸没液冷集群，将PUE直降1.1以下。更值得关注的是2026年华为联合三大运营商推出的“冷板式+浸没式”混合液冷方案，通过云端AI自调节冷却液流量，使数据中心能耗再降8%。一位参与项目的工程师告诉我：“现在不是选不选液冷，而是怎么用液冷才能把服务器寿命延长到5年不掉电。”

过去两年，“算力网络”更多是概念，而2025-2026年，真正的落地出现在国家东数西算节点。比如宁夏中卫的“算力超市”系统，通过实时感知全区域GPU利用率、电力碳排放因子和网络延迟，动态将低优先级训练任务调度到绿电富集时段，将西算集群的绿电使用比例从45%提升到78%。我曾在2025年Q3测试过一个分布式训练任务，系统在凌晨3点到早上8点自动切到风电偏多的宁夏节点，训练时间延长了15%，但碳排降低了42%。

英伟达在2025年发布的B200虽然在推理能效上比H100提升了近3倍，但真正的惊喜来自国内厂商。2026年上半年，燧原科技发布了基于国产先进工艺的“云燧T21”芯片，通过稀疏化推理引擎和自适应电压调节，在LLaMA-3 70B推理任务中实现每瓦性能比H100提升27%。更重要的是，其支持动态精度切换——当用户输入短文本时自动降低精度，长文本时提升精度，避免了“一精度吃遍天”的浪费。这种软硬协同的能效优化思路，正在成为行业共识。

在2026年4月的一次AI伦理闭门会上，一位海外学者的发言让我印象深刻：“我们一边用AI优化电网调度、预测森林火灾，一边又用更疯狂的算力训练更好玩的聊天机器人。” 这种矛盾直接指向AI伦理的核心问题之一：我们是否应该用“AI能解决碳中和”来为AI自身的能源消耗“洗白”？

我认为答案是否定的。因为AI的真正贡献在于通过精准预测减少其他行业的浪费，比如用扩散模型优化建筑设计以降低运行能耗，但如果训练这个模型本身消耗了原本可避免的煤炭发电量，那这就是“拆东墙补西墙”。2025年欧盟通过的《AI责任法案》首次明确要求：训练能耗超过10MWh的AI系统必须公开其“碳-效益比”，即单位能耗带来的减排效果必须在三年内抵消自身碳排放。这是一个值得全球借鉴的硬约束。

2025年底，某头部云服务商启动了“绿电优先”内部考核：每个AI项目立项时，必须提交一份“最小有效算力预算”——证明多投入一倍算力能带来的精度提升不超过3%，否则该项目自动降级使用低功耗硬件。这种做法导致部分研发团队的抵触，但一年后，该公司的AI训练总能耗竟下降了11%，而模型准确率平均只下降了0.4%。这说明我们对算力的“饥渴”中，有相当一部分是低效的、“为了用而用”的浪费。

作为一个在AI基础设施领域摸爬滚打了七八年的从业者，我越来越觉得：AI的发展不该是一场不顾后果的狂奔，而应该是一场清醒的“精准投放”。2026年的今天，我们有了更好的液冷、更聪明的调度、更高能效的芯片，但最重要的或许是每个工程师心里那把衡量“值不值”的尺子。

每次想要上更大集群跑更火模型之前，不妨先问自己一句：多花这一度电，人类真的能因此更幸福吗？ 如果答案模糊，那也许我们该停下，把剩下的算力留给更需要它的问题。

正文完

发表至：技术杂谈

2026-05-21

0