随着数据中心规模的空前发展,数据中心运维和运营也面临着严峻的挑战。管理者普遍关心的两大核心问题:如何让运维团队安全管理超大规模数据中心,如何最大化发挥数据中心资源的生产价值。面对挑战和核心问题,
华为全新数据中心管理系统DCIM+给出了答案。华为DCIM+利用云化、智能化技术重新定义数据中心管理系统,为数据中心提供了创新的运维管理解决方案。


随着数据中心规模的空前发展,数据中心运维和运营也面临着严峻的挑战。管理者普遍关心的两大核心问题:如何让运维团队安全管理超大规模数据中心,如何最大化发挥数据中心资源的生产价值。面对挑战和核心问题,华为全新
数据中心 <http://www.upsapp.com/>
管理系统DCIM+给出了答案。华为DCIM+利用云化、智能化技术重新定义数据中心管理系统,为数据中心提供了创新的运维管理解决方案。
   
  DCIM当今的一个热点话题
  
  DCIM 全称Data Center Infrastructure
Management,数据中心基础设施管理。DCIM是近两年在数据中心管理领域兴起的一个热点话题,旨在采用统一的平台同时管理关键基础设施如UPS、空调以及IT基础架构如服务器,并通过数据的分析和聚合,最大化提升数据中心的运营效率,提高可靠性。
  

  DCIM概念起源于国外,不同的机构对DCIM也有不同的定义,但同一的思想是DCIM工具可以架起一座沟通关键基础设施和IT设备之前的桥梁,从而帮助运营者管理数据中心。
  

  数据中心基础设施管理(DCIM)通过工具监控、管理和控制数据中心所有IT相关设备(例如服务器、存储和交换机)和基础设施相关设备(例如PDU和精密空调)的使用情况以及能耗水平。
  
  数据中心基础设施系统通过持续收集和管理数据中心 <http://www.upsapp.com/>
的资产、资源以及各种设备的运行状态,然后通过分析、整合提炼成有用的数据,从而帮助数据中心管理者管理数据中心并优化性能。
  
        DCIM为IT企业提供重要价值
  
  1.提供对数据中心电力、冷却和物理空间使用的持续重新优化,这可以帮助节省资金用于扩大现有数据中心或构建新的数据中心。
  
  2.整合IT与数据中心设施管理。这有助于拉近IT管理人员和设施管理人员的距离,为他们提供信息和分析,让这两个相互关联的职位重新走到一起。
  
  3.实现更高的能源效率。单从能源成本节约来看,就足以让企业考虑采购DCIM工具,更何况这些工具还提供其他好处,而这些好处可能更难以量化,例如改进工作流程。
  
  4.建模和/或模拟数据中心,让IT管理人员和设施管理人员可以分析“假设”场景。
  
  5.通过显示资源/资产如何关联,加强资源和资产管理。
  
  DCIM面对数据中心运维工作
  

  随着近几年云计算的快速兴起,数据中心日益集中化&大型化,数万机架的超大型数据中心正在陆续出现,导致数据中心的运维管理日益复杂化。因而,DCIM首先要面对数据中心运维工作存在着的人员和设施的问题和解决数据中心运维工作中管理关键基础设施问题。
  
  1、数据中心运维面临的人才队伍动荡
  

  根据2017年CDCC数据中心行业趋势调研结果显示,高达93.7%的运维中心管理受访者表示数据中心运维人才匮乏,不同技能水平人员层次梯队紧缺;而受限于薪资、职业前景等多种因素,人员离职率高,系统运维管理经验难以传承。另据Ponemon研究所的调查报告中的数据统计,2016年数据中心中断事故中,高达22%来自于人为错误;因此,获取足够水平合格、技能纯熟、有责任心的运维人员来支撑数据中心运维工作,成为了当前的一大难题。
  
  2、数据中心运维面临的巡检枯燥重复
  

  日常巡检是数据中心运维工作中重要一环,通过巡检可以尽早发现机房存在的各种隐患。一名运维人员在日复一日、重复枯燥的数百次或上千次抄表工作中,不懈怠、保持警觉性,从中发出某一个隐患,可能并不是人人均可胜任的。如果能够让不胜任的运维人员也能胜任当前工作,则人才匮乏的问题自然就解决了。或者更进一步,借助合适的辅助工具,让有限的人力摆脱重复性、机械性的工作,更加主动管理好数据中心,更好的发挥人的主观能动性。数据中心运维工作中人是最关键的因素,摆在我们面前的问题是运维人员如何在重复枯燥的抄表工作解脱出来,是我们运用DCIM的原始动力所在。
  
  3、数据中心安全运行指标与日俱增
  

  随着数据中心集中化&大型化的趋势发展,目前要求数据中心安全运维的层级分配愈来愈细致。一般来讲,需要保障系统和设备的正常运行;消防系统的完好;具备防水防火、防鼠措施;健全安全出入管理规定;保持机房清洁;建立供应商联系方式;工具和备件管理;事故应急流程和人员安全应急流程制定等。同时,还需要实现系统的连续性管理。这包括,保证所有基础设施设备正常运行;特别要注意发电机状态和自动启动功能、油料储备情况和供应条件等;还要注意可维护性和可快速可修复性检查,包括所有设备的维护和修复。
  
  4、智能化管理,帮助运维人员更高效的工作
  

  智能革命正在到来,将逐步重构现有的数据中心运维方式。如同智能工业机器人的出现,正在将一些劳动密集性产业重新改造成技术、资本密集性产业,解放人员的生产力,重构整个产业的竞争格局。而在数据中心运维中引入智能化技术,借助智能化管理系统来帮助运维人员分析问题、发现问题、解决问题,大幅降低对人员技能素质的要求,减少人工参与环节,从而保障数据中心的长期、可靠运行。例如:在日常巡检中,由智能化管理系统来自动完成各类抄表工作,自动分析与对比数据来发现问题,给出处理建议并通知用户;这样,将大幅减少日常巡检中的重复枯燥的工作,让人员聚焦于有创造力、更擅长的工作上。
   
  华为推出智能微模块3.0及全新数据中心管理系统DCIM+
  

  2017期间,华为首次发布智能微模块3.0及全新数据中心管理系统DCIM+。华为智能微模块3.0是数据中心在产品化、智能化上的创新实践,是从模块化走向智能化的里程碑,标志着数据中心从模块化迈入智能化时代。
  

  DCIM+区别于传统DCIM主要体现在三个方面:第一,通过云化架构实现多数据中心基础设施的统一管理,打通从IT资源到基础设施资源“云化”最后一公里;第二,通过精细化运营实现U位级容量管理和租户维度的运营分析,实现数据中心设施资源的价值最大化;第三,打造设备和管理系统软硬件一体化的智能解决方案,实现从基础监控到智能运维的飞跃。通过智能化的手段逐步减少人工巡检等例行重复工作,将数据中心运营经验、自动化的流程固化到DCIM+内,指导从业者运维数据中心。更希望通过云化、大数据和人工智能的技术方式,在运营层面超越人,成为数据中心运营、投资决策的重要支撑系统。
  

  DCIM不仅是一套软件系统,更应该是集设备智能感知、自动化流程指导和大数据运营决策的智能营维系统,华为已经同业内数家知名厂商展开合作,希望同业界同仁一起,加速数据中心智能化演进,构建智能DCIM+生态圈。

友情链接
KaDraw流程图
API参考文档
OK工具箱
云服务器优惠
阿里云优惠券
腾讯云优惠券
华为云优惠券
站点信息
问题反馈
邮箱:[email protected]
QQ群:637538335
关注微信