从「算力霸权」到「伦理觉醒」：我读2025-2026年AI基础设施的四个关键转向

15次阅读

共计 2366 个字符，预计需要花费 6 分钟才能阅读完成。

2025年我花了不少时间重读《人工智能：一种现代方法》的第四版，但很快发现书架上的经典已经追不上现实。今年3月，Meta开源了Llama 4的8B和70B版本；6月，DeepSeek发布了MoE架构的第三代推理模型，推理成本降至每百万token 0.06美元。这些数字背后隐藏着一个信号——AI行业的底层逻辑正在从“模型竞赛”转向“基础设施博弈”。我这篇读书笔记，想聊聊2025-2026年我观察到的四个关键转向，以及它们如何重塑我们对AI伦理与实践的理解。

过去两年，业内习惯用“万卡集群”衡量实力。但2025年Q1的数据很有趣：英伟达B200 GPU的出货量首次出现季度环比下降，取而代之的是AMD MI400、Intel Gaudi 3以及大量基于RISC-V的AI加速器开始占据新增算力的30%。我偶然读到一篇论文《Heterogeneous AI Infrastructure: The Case for Composable Computing》，其中提到2026年超大规模数据中心将普遍采用“CPU+GPU+NPU+光互联”的混合架构。这让我想起《计算机系统要素》里的那句话：“真正决定系统效率的不是单个部件，而是它们如何被编排”。

案例：2025年12月，百度阳泉智算中心公开了他们的“星海”调度系统，能在30秒内动态将闲置的光学神经网络处理器（ONNP）分配给实时语音推理任务，推理延迟降低42%，功耗却只增加7%。这不是论文里的设想，而是已经在运营商客服场景落地的方案。读到这里，我放下手中的书——基础设施的“软硬协同”不再是口号，而是实实在在的工程挑战。

2026年1月，一篇《The Hidden Costs of Synthetic Data》的深度报告让我后背发凉。报告指出，前十大开源数据集中，平均有23%的文本来自生成模型（包括GPT-4o和Claude 3.5）的自我循环输出。这意味着我们正在用AI生成的“水”来灌溉下一代模型，而水的质量在每一轮迭代中衰减。更具讽刺意味的是，这些合成数据中隐藏的偏见——比如对特定方言的歧视性省略——会被放大。

我重读《数据伦理》中的“价值链责任”章节，发现作者Andrew Selbst早在2022年就警告过：“数据供应链的每一环都可能是伦理失效的点”。2025年最典型的案例是Midjourney V7的“风格坍塌”事件：当用户要求生成“非洲油画”时，模型产出大量带有殖民视角的模拟作品，根源在于其训练数据中有高达87%的“非洲艺术”图像实际来自西方美术馆的数字化展品，而非非洲本土创作。这让我开始反思：我们所谓的“数据清洗”，是否只是在清洗自己认知范围之外的“他者”？

2026年3月，OpenAI宣布GPT-5o的API价格降至每百万输入token 0.15美元，几乎是2023年GPT-4价格的千分之一。同期，Mistral发布了专为端侧设备量化的7B模型，在骁龙8 Gen 4上跑出55 tokens/s的速度。这引出一个伦理问题：AI确实变得更便宜了，但它真的更普惠了吗？

《The AI Divide》一书中的研究数据触目惊心：尽管推理成本下降了90%，但能够调用最新API的用户群体中，拉丁美洲和非洲仅占4%和1.7%，大部分流量仍然集中在北美和东亚。更隐蔽的障碍是网络基础设施——在印度农村，一次云端推理的平均响应时间是13秒，是旧金山用户的40倍。2025年9月，我与一位埃塞俄比亚创业者交流，他告诉我：“我们没有资格享用‘低成本’的GPT-5o，因为我们本地没有数据中心，跨洲数据传输费比推理费还贵。”这让我意识到，“智能平权”的前提从来不只是模型价格，而是全球网络基础设施的公平性。

2025年底，欧盟AI Act正式生效的第二阶段，对高风险AI系统提出“可解释性”强制要求。但我读到了一则令人震惊的案例：2026年2月，某主流法律科技公司推出的“合同风险自动审核”系统被发现存在系统性偏差——当合同文本中的甲方是女性名字时，模型识别出30%的“模糊条款”被自动标记为“合理”，而对男性甲方仅有11%。工程师的解释是训练数据中女总裁的占比不足5%。法律AI公司迅速修改了模型，但他们同时也承认：模型中的“偏见”在被公众发现前，已经处理了超过400万份合同。

我由此联想到《算法正义》中引用的一句话：“当法律跟不上技术时，工程师就是第一道门槛。” 2025-2026年，越来越多的企业开始设立“伦理基础设施工程师”岗位——不是做合规的律师，而是能写代码检查数据流中的歧视性模式、能在训练前动态调整数据集权重的技术人员。这或许是我们这代人最应该补的课：把伦理写进Makefile，而不是写在PPT里。

读完全年的书和文章，我发现一个贯穿的主题——2025-2026年AI领域的真正分野，不是模型谁更好，而是基础设施谁更负责任。从算力异构化带来的能耗博弈，到原生数据污染背后的认知殖民，再到全球网络分布不均造成的智能鸿沟，每一个技术决策底层都是伦理选择。如果你也关注这个领域，我特别推荐三篇一起读：《The Infrastructure of AI》（2025 J. R. Brown）、《Data Colonialism Revisited》（2026 E. M. Jenkins）以及NIST刚刚发布的《AI Ethics Engineering Framework v2.0》。它们会把你从“参数狂热”中拉回来，重新看见那些被算法光芒遮蔽的、沉默的、真实的基础设施。

正文完

发表至：读书笔记

2026-05-16

0