什么是数据中心基础设施管理 (DCIM)?

数据中心基础设施管理 (DCIM) 是组织内 IT 基础设施、运营和楼宇设施功能的融合。DCIM 计划旨在为管理员提供数据中心性能的全方位信息,从而尽可能高效地利用能源、设备和数据中心的物理空间。

DCIM 软件可以测量、监控和管理数据中心的 IT 设备及支持基础设施。这使得数据中心运营商能够高效运营,同时改进基础设施设计规划。DCIM 软件可以作为软件即服务 (SaaS) 托管在本地或云端。

数据中心基础设施管理工具可以帮助管理员定位和识别建筑物与其 IT 系统之间的关系。例如,可以安装能源监测传感器和支持硬件来测量和管理 IT 设备和基础设施组件(例如配电单元 (PDU))的能耗。然后,同一系统可以分析电源使用效率和冷却系统的能效。

DCIM 如何运作?

DCIM 工具收集并集中来自数据中心部署的基础设施组件(通常还包括更广泛的设备,例如端点系统)的各种重要数据,以及一系列数据中心功率、温度和其他环境参数。这些数据将根据既定基准进行存储和处理,以提供有关组织基础设施的历史和实时预测洞察。如果正确实施,DCIM 可以通过统一的界面或单一管理平台对整个基础设施进行全面的监督和管理。

DCIM 组件通常包含几个关键要素,包括:

  • 集中式数据库。该数据库包含每个受管系统或设备的详细信息。这是一项详细的资产管理工作,涵盖服务器、存储和网络设备、配电单元、供暖、通风和空调等系统以及温度和湿度等环境传感器。
  • DCIM 软件。该软件访问集中式数据库,收集并存储每个受管设备的预期性能指标。该软件可以实时显示功耗和能效等指标,并报告系统随时间变化的详细信息,例如系统使用情况。历史数据可以指示对数据中心任务(例如容量规划)至关重要的趋势,或建议基础设施优化。
  • 仪表板用户界面 (UI)。实时 DCIM 软件通过实时仪表板 UI 共享其大部分数据,还可以生成实时警报,例如系统健康状况问题或服务器机架温度意外升高,以及定期的性能报告。UI 通常可以生成详细的可视化效果,例如图表和图形。
  • 软件连接器。虽然某些系统和设备可以直接与 DCIM 软件通信,但通常需要使用诸如应用程序编程接口 (API) 之类的软件连接器,才能将设备纳入 DCIM 范围并收集所需数据。连接器可以从 DCIM 或系统供应商处获取,有时也可以使用标准编程工具和技术自行开发。为了确保 DCIM 的有效性,DCIM 软件必须能够识别并兼容所有受管理的系统和设备。
DCIM为什么重要?

DCIM提供了各种好处,但最重要的是它的范围。长期以来,IT一直受到互不相关的考虑因素的困扰,有时甚至是相互竞争的考虑因素。例如,不同的团队可能管理不同的服务器或存储;一个完全不同的团队可能负责该设施; IT和业务经理需要确定服务的内容以及它的工作情况。每个关注点都可能采用专门的或特定于供应商的管理工具来解决其责任领域的问题。

这些类型的脱节导致IT实践缓慢且效率低下。业务和技术领导者几乎不可能全面了解所有设备及其运营行为。洞察力和控制方面的差距浪费了时间,增加了运营成本,使IT变得不灵活且难以故障排除,并且越来越容易导致业务容易受到合规性和业务连续性问题的影响。

用最直接的话说,DCIM通过集中知识和控制来修复以下脱节:

  • DCIM建立并维护所有运行中设备、装置和服务的全面记录。
  • DCIM编制了设备、设备、设施和服务之间的一组明确的依赖关系和相互关系,包括集团或部门级别的所有权。
  • DCIM可以通过单个界面管理数据中心。
  • DCIM实现实时可观察性、警报和全面报告,支持强大的变更管理并加速故障排除。
DCIM 有哪些优势?

DCIM 的优势包括:

  • 延长正常运行时间。监控设备并根据收集到的数据生成报告,有助于企业确定其数据中心的健康状况以及是否需要更换设备。
  • 更高效的资源利用。DCIM 使数据中心管理人员能够监控整个企业和设施资源(例如电力使用情况、冷却系统和物理空间)的健康状况和性能。企业通常利用这些洞察来优化 IT 资源效率。
  • 容量管理。DCIM 软件功能可帮助企业为新硬件和设备建模和分配空间,并管理其电力链。
  • 主动事件管理。实时管理功能使设施管理人员能够深入了解其数据中心的当前和未来状态。
  • 能源管理。DCIM 使企业能够测量所有 IT 相关设备的能耗。这种洞察有助于他们降低能源使用量和成本。
  • 提高生产力。DCIM 使 IT 部门能够远程监控多个位置。这有利于边缘数据中心,因为自动警报可以帮助 IT 部门跟踪物理和逻辑组件,并发出组件故障警告。
DCIM 面临哪些挑战?

DCIM 也存在以下缺点:

  • 安全性。DCIM 连接多个关键系统,增加了潜在的入口点数量。
  • 数据孤岛。集成来自不同来源(例如电力系统、冷却系统和 IT 设备)的数据时,经常会出现问题。数据可能不兼容、需要转换或丢失,从而可能导致管理漏洞。
  • 环境监控。应使用温度传感器仔细监控机架中的服务器和其他 IT 设备,以确保设备不会过热。根据环境的不同,这可能会花费不菲。
  • 设施系统。较旧的数据中心可能缺乏系统或未更新设备。例如,数据中心可能没有实时的公用事业电能计量。它可能需要根据其公用事业账单来确定总能耗,这可能会增加功耗。同样,较旧的设备缺乏温度传感器可能意味着组织必须投资更新的设备。
  • 技能组合。DCIM 系统的实施可能很繁琐,并且通常需要规范和持续的实践才能正确管理。员工必须接受所选 DCIM 软件的培训并具备相关经验,并遵循经过严格审查的 DCIM 实践。这需要熟练掌握 DCIM 工具和业务流程。
DCIM 的组件有哪些?

DCIM 组件围绕着架构,并支持 IT 功能和基础设施。这些具体的组件和功能包括:

  • 物理架构。这包括服务器、网络交换机、气流、冷却系统和配电单元 (PDU) 等硬件组件的占地面积考量。
  • 材料目录。DCIM 技术包含材料清单库。这些清单可能包含基本规格、服务器、存储和网络设备或 PDU。供应商会定期更新和维护这些清单。
  • 容量规划。未来容量规划包括估算空间、计算机硬件、软件和连接基础设施资源。DCIM 软件可以根据指定的限制构建未来场景的模型。
  • 变更管理。DCIM 必须考虑硬件更换,以避免停机或故障等风险。它还必须考虑流程变更,并可用于维护请求和工单的审计跟踪。
  • 软件集成。DCIM 软件可以与现有的管理软件集成,以更好地跟踪自动化和集成的数据中心工作流程。
  • 数据分析。DCIM 软件还可以收集实时数据,例如硬件指标,这有助于缓解中断或其他事件。
如何开始使用 DCIM

对于组织来说,一个合理的策略是分阶段实施 DCIM,从最低限度开始,逐步升级功能。通过这种方式实施 DCIM,可以简化迁移过程。例如,企业可以从创建电子表格过渡到实施自动化数据中心资产管理软件。从这些快速简便的实践经验出发,企业可以着手采用其他 DCIM 方面,例如容量、电源和环境。

企业应该寻找符合其物理架构以及监控、变更管理、扩展和容量规划、物料编目和数据可视化需求的 DCIM 软件。数据可视化是数据中心信息的呈现方式,例如仪表板、趋势图、报告、机架和行列视图以及楼层布局图。

DCIM 工具可能是一个庞大而复杂的平台。一旦采用并实施,它们可能极难改变,因此产品审核和选择过程至关重要。强烈建议开展 DCIM 概念验证计划,以确保所考虑的管理工具能够满足业务需求、提供必要的集成、呈现易于管理的学习曲线,并为企业提供未来功能和可扩展性。