满足AI与现代化算力负载需求

为支持人工智能/机器学习训练等高性能计算算力负载,后端网络采用脊叶式(spine-leaf)架构,其中叶交换机与所有脊交换机相连。在专为特定任务构建的AI计算单元(集群)中,叶交换机为GPU(图形处理单元)之间提供高带宽、低延迟的互连。脊交换机与叶交换机通常以800G以太网速率连接,且即将实现1.6T的速率,而交换机到服务器的速率则主要通过以太网或InfiniBand™协议达到400G。为确保通用算力负载的顺畅连接以及与后端网络之间的数据传输,前端网络正迅速向以太网交换机到交换机的200/400G链路,以及交换机到服务器的25/50/100G链路迁移。高性能前端网络对于加速用户和设备的AI推理请求、提升整体体验至关重要。

弥合AI鸿沟

随着人工智能和机器学习的发展,数据中心格局正在发生转变。因此云和大型企业数据中心要构建一种新的后端网络,以支持AI训练等高性能算力负载。传统前端网络正朝着面向通用算力负载和外部连接的方向发展

  • 后端⽹络 – 脊叶架构,通过超高速、低延迟的东西向数据传输互连GPU集群,专用于AI训练任务。

  • 前端⽹络 – 基于客户端的传统脊叶架构,采用以太网交换技术连接CPU服务器与存储阵列,依托南北向数据传输实现互联网接入、数据存储迁移及AI推理请求处理。

在当今数据中心积极拥抱AI革命之际,西蒙深知基础设施的重要性——它能将高性能后端网络与灵活的前端网络无缝连接起来,同时满足不同环境的独特连接需求。无论您是在单个机柜中容纳用于边缘AI的后端和前端网络、还是仅用少量机柜构建入门级AI实验平台,抑或是通过大型复杂的轨道优化计算单元来大规模扩展AI训练,西蒙都能提供全方位解决方案,确保卓越的前端和后端网络性能——无论您的拓扑结构如何,或处于AI旅程的哪个阶段。

有4种不同类型的网络互连区域:

01 前端,交换机到交换机

02 前端,交换机到服务器

03 后端,交换机到交换机

04 后端,交换机到节点

让我们更详细地来了解一下每个互连区域:

新兴AI数据中心网络架构与应用——从传统前端到驱动AI的后端

  前端网络 | 交换机到交换机互连  

新兴AI数据中心网络架构与应用——从传统前端到驱动AI的后端

  • 传统的前端网络使用 200G 和 400G 以太网来实现交换机到交换机的连接。

  • 连接方式通常为列间(row-to-row)连接,但在小型数据中心中也可采用列末(EoR)或列中(MoR)拓扑结构。

  • 扇出分支配置(如2 x 200G、2 x 100G、4 x 100G)可最大限度地提高交换机连接的端口利用率和空间效率。

西蒙的前端网络交换机到交换机解决方案:

DAC (直连铜缆)用于机柜内连接(典型传输距离为3米)

AOC (有源光缆)用于单列机柜间连接(典型传输距离可达30米)

BASE-8 MTP布线系统,包含配线箱、配线架和模块组件(典型传输距离超过10米)

前端网络 | 交换机到服务器互连

新兴AI数据中心网络架构与应用——从传统前端到驱动AI的后端

  • 前端网络的接入交换机正在向100G 和 200G 以太网迁移。

  • 支持 25G、50G 或 100G 服务器链路。

  • 扇出分支配置(如2 x 200G、2 x 100G、4 x 100G)最大限度地提高端口利用率和空间效率。

  • 前端交换机到服务器连接使用列末(EoR)/ 列中(MoR)或柜顶(ToR)拓扑结构。

  • 具体拓扑方案选择取决于数据中心的大小和布局。

西蒙的前端网络交换机到服务器解决方案:

DAC (直连铜缆)用于机柜内连接(典型传输距离为3米)

LC 和 MTP 跳线用于机柜内连接(典型传输距离为3米)

6/6A 类SkinnyPatch铜缆跳线用于10G应用(典型传输距离为3米)

AOC (有源光缆)用于单列机柜间连接(典型传输距离可达30米)

BASE-8 MTP布线系统,包含配线箱、配线架和模块组件(典型传输距离超过10米)

后端网络 | 交换机到交换机互连  

新兴AI数据中心网络架构与应用——从传统前端到驱动AI的后端
  • 高性能计算后端网络采用800G以太网脊叶架构,并逐步向1.6T以太网技术演进。

  • 支持通过列末(EoR)或列中(MoR)拓扑实现列间或列内连接。

  • 柜顶(ToR)拓扑适用于小型边缘/入门级AI场景,可实现脊叶交换机同柜部署。

西蒙的后端网络交换机到交换机解决方案:

DAC (直连铜缆)用于机柜内连接(典型传输距离为3米)

ACC/AEC (有源铜缆/有源电缆)用于单列机柜间连接(典型传输距离可达3-5米)

AOC (有源光缆)用于单列机柜间连接(典型传输距离可达30米)

BASE-8 MTP多模/APC和单模布线系统,包含配线箱、配线架和模块组件(典型传输距离超过10米)

后端网络 | 交换机到节点互连

新兴AI数据中心网络架构与应用——从传统前端到驱动AI的后端  
  • AI计算单元采用服务器节点内GPU的400G连接,每个连接均与不同的叶交换机相连,以优化GPU间通信。

  • 通常通过高密度800G叶交换机实现,采用2×400G扇出分支配置。

  • 每个服务器节点还需配置CPU至前端网络的连接(通常为100G),用于存储与管理。

  • 采用低速铜缆连接实现带外管理。

  西蒙的后端网络交换机到节点解决方案:

DAC (直连铜缆)用于机柜内连接(典型传输距离为3米)

ACC/AEC(有源铜缆/有源电缆)用于机柜/计算单元(Pod)内连接(典型传输距离可达3-5米)

AOC(有源光缆)用于单列机柜间连接(典型传输距离可达30米)

6/6A 类SkinnyPatch铜缆跳线用于10G应用(典型传输距离为3米)

BASE-8 MTP 多模/APC点对点线缆(典型传输距离为3-50米)

BASE-8 MTP 布线系统,包含配线箱、配线架和模块组件(典型传输距离超过10米)  

西蒙提供支持各种拓扑结构的AI适配解决方案

数据中心布线拓扑结构多样,后端与前端网络可能在不同距离上采用点对点或结构化布线方案。连接方式包含:列间连接、机柜间连接(列末/列中)以及机柜内连接(柜顶)。交换机间及交换机至服务器的链路可采用扇出分支配置,最大化端口利用率并节省空间。

西蒙可为任何距离、拓扑和扇出分支配置提供全系列高性能布线解决方案。这包括无源和有源直连铜缆 (DAC) 组件、有源光缆 (AOC) 以及光纤和铜缆结构化布线系统。

新兴AI数据中心网络架构与应用——从传统前端到驱动AI的后端

拓扑结构和布线的关键考虑因素包括:

  • 空间与布局 – 数据中心的布局、空间以及不同区域之间的距离会影响拓扑结构和布线方案的选择。

  • 灵活性与可扩展性 – 使用配线架的结构化布线能够实现灵活的交叉连接,简化运维和升级流程。这使得在不断扩展的AI网络中集成新的计算模块变得更加便捷。

  • 供电与散热 – 将交换机和服务器共置于同一机柜(柜顶)会增加机柜的功率密度,因此需要强大的基础设施支持。

  • 延迟 – 在柜顶和列中拓扑结构中,点对点直连铜缆(DAC)具有更低的延迟和功耗。

  • 损耗性能 – 对于较长距离的结构化布线(列间和列末/列中),超低损耗的BASE-8多模和单模布线能够最大限度地提升性能。

新兴AI数据中心网络架构与应用——从传统前端到驱动AI的后端