边缘计算能让人工智能更具可持续性吗?

现代人工智能(AI)工作负载所需的庞大数据中心及巨大电力需求,对环境和可持续发展产生了不容忽视的影响。此外,许多机构签署的可持续发展承诺与其实际的AI应用情况并不相符。

高盛(Goldman Sachs)的研究预测,受人工智能(AI)基础设施建设的推动,美国数据中心的电力需求将翻一番以上,从2025年的31吉瓦(GW)攀升至2027年的66吉瓦。目前,AI工作负载占全球数据中心需求的14%,预计到2027年这一比例将达到27%。这些数据表明,如果不改变推理工作负载的运行位置,将难以实现碳排放目标或构建可持续的AI基础设施。

为了缓解电力问题,企业可以转向边缘计算。边缘计算将AI推理任务转移到数据生成源附近,而不是将所有数据传输到集中式云端设施。

了解边缘AI在可持续发展方面的优势

边缘AI具有一系列潜在的可持续发展优势,包括:

降低数据传输能耗

将原始数据传输到集中式云数据中心时,每一个网络跳转(hop)都会消耗能量。边缘架构减轻了这种负担,因为它们在本地进行处理,仅向上游发送事件、异常情况或摘要信息,而不是持续传输原始数据流。

在工业监控或视频监控等设备持续产生海量数据的应用场景中,能耗的降低还能减少网络能耗成本及对云端算力的需求。

本地化处理效率

云端GPU基础设施通常针对大规模模型训练进行了优化。若将其用于重复性的特定推理任务,往往只能发挥其设计容量的一小部分,却仍需承担全部的运营开销。相比之下,边缘硬件专为低功耗推理而设计。

“如果在每个站点都部署性能过剩的硬件、持续运行模型、设备利用率低下且不考虑硬件生命周期,那么其在节能方面的优势就会迅速减弱,”设计并制造嵌入式系统及AI赋能产品的Sheridan Technologies公司首席执行官James Sheridan表示。

降低冷却与基础设施开销

冷却系统是AI数据中心最大的耗电环节之一。根据国际能源署(IEA)2026年4月的分析,冷却能耗占数据中心总能耗的比例高达30%。

更高的GPU密度导致每个机架产生的热量增加,迫使设施采用更密集的冷却基础设施。而边缘设备既不需要主动冷却系统,也不需要水冷基础设施。

边缘 AI 在何时适用?

边缘 AI 并非适用于所有 AI 部署场景的万能方案,但在特定情况下,它确实具有显著优势。

Sheridan 说道:“我会从工作负载入手,而不是先考虑架构偏好。”

边缘计算的最佳应用场景

对于那些对延迟敏感、要求全天候可用,或者处于连接受限及数据敏感环境(即云端传输可能引发合规风险)的应用而言,边缘计算表现优异。制造业质量控制、自动驾驶系统以及即时检测(point-of-care diagnostics)就是常见的例子。针对持续进行的大规模推理任务,虽然前期硬件投入较高,但这通常能通过降低后续在云服务、数据传输及能源方面的开销来抵消成本。

不过,并非所有企业都有条件使用云服务。

EdgeRunner AI 首席执行官 Tyler Saltsman 表示:“问题不应是‘边缘计算是否优于云计算’,而应是‘该系统究竟需要在何种环境中运行’。”Saltsman 致力于国防及关键基础设施领域的 AI 部署工作。

尽管具备上述优势,边缘部署也存在弊端。边缘 AI 运行在神经处理单元(NPU)上——这是一类专用芯片,目前尚无统一的市场标准,因此往往需要针对不同型号的芯片对模型进行重新设计或调整。

Alchemy Consulting 首席信息官(CIO)兼 AI 治理顾问 David Viney 指出:“目前的 NPU 生态系统高度碎片化;模型需要针对不同芯片型号进行人工调优,这对于大多数没有专业机器学习(ML)工程团队的 IT 部门来说,往往会导致投资回报率(ROI)无法达到预期,从而放弃该方案。”

Viney 指出,像 Rentokil 和通用电气(General Electric)铁路部门这样的公司已经成功实现了这一点。这两家公司在人工智能应用加速普及之前,就已经构建了物联网(IoT)基础设施,并具备深厚的技术实力,能够大规模管理模型更新、补丁修复、性能漂移监控以及硬件更换。

云技术的最佳适用场景

云技术最适合大规模模型训练和需要大量算力的通用人工智能工作负载。对于需要频繁更新模型或进行集中式数据聚合的应用场景,云基础设施仍然是更优的选择。

关于边缘计算,IT 领导者还应考虑一个涉及可持续性的反向观点。

Sheridan 说道:“云人工智能服务商已经在规模化处理电力、散热、资源利用率和基础设施效率等问题。如果他们的基础设施优化程度远超你的企业,那么将工作负载迁移到本地并不一定能自动提升投资回报率(ROI)或改善可持续性。”

边缘人工智能的可持续性指标

在构建或评估边缘人工智能项目时,IT 领导者应将以下指标纳入“绿色人工智能”战略进行跟踪:

  • 电源使用效率(PUE)。PUE 是设施总能耗与 IT 设备能耗之比。该指标适用于衡量集中式基础设施的效率,但对于边缘部署而言,其直接适用性有限,因为边缘部署通常不涉及需要单独计量的设施级开销。对于边缘计算,更具参考价值的比较指标是单次推理任务的能耗,而非设施层面的效率。
  • 单次推理能耗。与 PUE 相比,这是一个更适合边缘计算的指标。它衡量的是针对同一工作负载,在边缘和云端不同方案下,每次人工智能事务消耗的能量(以焦耳或瓦时为单位)。如果某个站点将原本在云端处理的工作负载转为在边缘端进行推理,便可以直接对比前后的能耗差异。
  • 单项人工智能工作负载的碳足迹。指特定人工智能工作流程产生的温室气体排放总量,涵盖电力来源、硬件能效以及网络传输能耗。
  • 总拥有成本(TCO,含能源成本)。这包括硬件采购、运营开销、能源成本以及整个部署生命周期内的模型管理费用。
  • 合规性与 ESG(环境、社会和公司治理)报告,包括范围 1、范围 2 和范围 3 排放。范围 1 涵盖由企业拥有或控制的源头产生的直接排放;范围 2 涵盖外购电力产生的排放;范围 3 则延伸至供应链排放,包括云服务商的基础设施、硬件制造以及设备更换周期等环节。在美国,证券交易委员会(SEC)的气候信息披露规则要求上市公司报告范围 1 和范围 2 的排放情况。在欧盟,《企业可持续发展报告指令》(CSRD)和《人工智能法案》针对人工智能系统设定了额外的能源报告要求。

边缘计算、人工智能与可持续发展的未来

两大发展趋势正在重塑边缘人工智能(Edge AI)基础设施。

首先是小型语言模型(SLM)。SLM 是一种针对特定任务设计的紧凑型人工智能模型,能够在低功耗硬件上运行,因此非常适合边缘人工智能的应用场景。

第二个主要趋势是智能体人工智能(Agentic AI),它催生了对持续性本地计算和推理的新需求。

Sheridan 指出,最合理的模式是将常规任务分配给本地硬件处理,而将云端算力留给真正需要它的任务。SLM 性能的提升使得这种任务分流变得切实可行。

“未来将有更多系统采用混合模式:利用小型本地模型处理快速、私密、重复性或事件驱动的任务,仅在需要深度推理或更广泛上下文信息时才调用大型云端模型,”Sheridan 说道。

在智能体人工智能领域,实现能效提升的挑战更大。如果智能体持续运行并在每个周期都调用模型,其在本地硬件上消耗的算力可能与在云端运行相当。

“可持续发展效益的实现取决于规范性操作:使用较小的模型,仅在必要时运行,缓存结果,有选择地进行任务升级(即转由更强大的模型处理),并衡量实际工作负载,”Sheridan 说道。

Viney 认为,向智能体人工智能的转变将推动基础设施投资流向更靠近现有企业系统的分布式托管环境,而不是盲目扩建超大规模数据中心。在他看来,这种模式从本质上讲,比将所有任务都汇集到大型集中式设施中更具能效。

合规要求正使“工作负载级能耗追踪”成为一项业务必要举措。欧盟的《企业可持续发展报告指令》(CSRD)和《人工智能法案》(AI Act)都要求披露人工智能系统的能耗与碳排放信息。在美国,证券交易委员会(SEC)的气候信息披露规则要求上市公司报告范围 1(直接排放)和范围 2(能源间接排放)的温室气体排放量。

Sheridan 表示,这些压力可能会改变企业对人工智能的考量方式:从单纯的“我们能在这里使用人工智能吗?”转变为“应该使用什么模型?在哪里运行?成本如何?能耗特征怎样?又能带来什么商业价值?”

Viney 也预见到了这一转变,并直言不讳地指出了大多数企业目前的处境。

“那些已经开始追踪每个工作负载碳排放量的企业,将在合规方面占据先机。而大多数企业尚未做到这一点,”Viney 说道。