会员登录 注册新帐号电脑店行业门户 | U盘启动工具

首页

 电脑店主页 > 产品技术 > 服务器储存 > 服务器 > 数据中心 > 数据中心管理的最佳方案

数据中心管理的最佳方案

发布时间:2017-06-02 10:50      点击:     关注官方微博:

 数据中心基础设施管理(DCIM)有助于规划公司的基础设施及改进数据中心的管理。但是,DCIM也可能导致IT部门与设备部门之间缺乏协调。在本文中,将了解如何帮助这两个团队积极有效的沟通、配合,通过使用不同的DCIM产品和工具成功地管理数据中心。这是获得处理数据中心管理及目前不断变化的服务器技术问题的最优方法。

  使用DCIM工具数据中心管理

  顾名思义,数据中心基础设施管理(DCIM)能够帮助企业、公司对数据中心进行有效管理。可当你如果询问数据中心不同部门的工作人员,“基础设施”是什么,都包含什么,你将会从他们口中得到不同的答案。对于不同供应商提供的当前的DCIM产品,情况也是如此。

  DCIM工作及作用:

  在一些案例中,DCIM产品是在传统楼宇管理系统(BMS)基础上建立起来的管理工具。这些工具旨在提供各类设备能源使用情况,以方便便设备团队人员能更好的管理主要电力系统与冷却系统。

  有些DCIM工具就是提供从UPS(不间断电源)的输出收集基本负载信息或者“IT设备总功率”,然后将其与“机房内总功率”进行比较,从而得出使用效率(PUE)的结果。该信息将应用于提高数据中心的电力和制冷效率,优化数据中心管理。

  其他DCIM平台旨在帮助IT管理人员监控机架内IT设备电源及运行环境。一些供应商的DCIM工具将IT资产管理功能和能源使用监控的组合。许多DCIM供应商还提供可视化平台,它可提供查询各个机架、单个服务器以及IT设备功耗的功耗。DCIM工具包甚至可以提供每个机架及其各IT设备能源利用率、温度和湿度。当然,没有众所周知的PUE(电源使用效率)指标计算器,任何DCIM工具包都是不完整的。因此,即使是面向IT的工具包也需要能够容纳有关设备功耗信息。

  现在, 有很少几个DCIM平台用于直接控制IT设备。它们还无法自动测量或直接控制设备电力系统以及其他设备(例如冷却系统),为了满足不同的计算负载。大多数DCIM工具旨在提供更好地洞察力及分析不同系统的能源利用。当然,必须首先购买和安装必要的能源测量设备。

  使用DCIM工具进行能量监控

  购买能源测量设备是许多项目的绊脚石。为设备安装所需的电气工作量会产生额外费用,在某些情况下,电气工作开始之前必须将系统关闭。当然,在数据中心中关键设施中,关机是从来不会被考虑的。

  通过DCIM系统将收集和分析能耗信息, 能源监控硬件必须安装在公用事业切换点,电气面板以及与设备相关的设备(如冷水机组,CRAC,泵等)上。 需要对冷却基础设施进行深入分析。

  在IT设备方面, DCIM系统可能仅用于收集UPS输出数据,或通过对机架或IT进行设备级监控提供更详细的信息。测量IT设备功率的最常见方法是安装智能配电单元( iPDU)。

  有些供应商提供的DCIM软件,可以接受来自其他供应商的现有设备(例如UPS)的数据以及专用硬件。其他的供应商提供硬件传感器和软件。还有些供应商DCIM提供托管服务——将传感器的信息通过互联网发送到托管系统,并可通过网页界面查看该信息。DCIM软件也可以安装在本地服务器上。

  有些DCIM平台可提供资产和能源管理相结合的功能。当然,在一些案例中,此平台只是一个汇报工具,不能管理任何基础设施或IT系统设备。

  DCIM的挑战与局限性

  其中,DCIM供应商面临的主要问题是使DCIM同时适用于设备团队与IT团队。不过,想让DCIM令双方都满意还有一定难度,必须由经验丰富技术人员来处理与安装测量设备相关技术问题与运维问题。此外数据中心管理团队必须能够克服将任何DCIM代理软件与IT计算架构进行接口和集成的潜在稳定性和安全性问题。

  一些软件供应商与硬件商已经开始合作,提供完整解决方案。然而,每个案例是不同的,之所以让 IT团队与设备团队的共同努力,就是为了成功安装监控硬件。与现有的楼宇管理系统接口连接、提取信息仍需IT团队与设备团队共同努力。

  综上所述,数据中心内各个部门对DCIM意味着什么和它应该执行的功能有不同的期望。设备团队期望DCIM专注于电力和冷却基础设施。IT团队期望DCIM能够满足机架与IT设备级要求。理想情况下,DCIM应该能够查看IT流程、计算负载、应用程序和虚拟化软件以及底层计算硬件,从而改进数据中心管理。

  最终,最有效的DCIM工具将是实时的,能够实时接收、了解计算负载,然后提高(或降低)电力和冷却系统以满足预期的负载。DCIM目前处于发展初期,对目前的问题可以在后续改进。

  另一个根本问题是谁最终控制系统管理和操作,并承担相应的责任。IT团队不希望中央控制台这类工具就像是基础架构管理工具包,这可能会影响IT系统架构的运行的稳定性,而设备团队不希望IT团队的服务器管理软件控制冷却系统。

  数据中心管理和服务器技术趋势

  服务器的发展总是超出我们的想象,似乎我们总在跟随服务器的发展而发展。在意识到这一点之前,IT专业人员技术水平的更新已经落于服务器的发展,大家都在以更快的速度了解被他们忽视的新技术。有时候,你会发现似乎大家总想让自身的数据中心成为行业的佼佼者,而忽略一些需要掌握的技术。

  根据SearchDataCenter.com对数据中心进行的调研来看,通过收集有关硬件、操作系统、虚拟化、云、以及数据中心设备管理管理信息。发布一份调研报告。

  Stephen Bigelow: 我们从1U、2U和刀片服务器了解到,这些服务器都比以往需要更高的运算效率,但数据中心所有者和运营商如何选择和购买新的服务器技术呢?

  Bill Kleyman: 这里要记住的关键是每个数据中心都是不完全一样的,都有自己的特点。在管理人员购买新服务器之前,他们需要评估数据中心的买它们用来实现什么,有什么样的目标?是要快速扩张?是为了要系统备份?搭建虚拟环境?例如,有一家发展缓慢的制造公司,不想要系统经常升级或者将部分虚拟机( VM )从平台中剔除。

  基于以上原因,管理员与IT管理人员都在考虑购置他们需要的服务器。把钱花在刀片系统上是个不错的选择。把钱花在1U或2U“机架安装”服务器上也是不错的选择。重要的是要了解选择的设备是否满足数据中心需求。如果管理员正在考虑进行桌面虚拟化项目,那么,刀片服务器会更适合该项目发展。但是,如果想要工作平台运行稳定,又不能快速扩张,这种情况,就不需要购买刀片服务器,增加1U、2U服务器即可。通过使用很少的1U服务器,就可以使用户达到高密、高可靠性。要记住,重要的是让管理人员在购买前深思熟虑,在充分了解自身使用环境后,确定需要购买什么类型的服务器,再去购买。

  (备注:失效备援是系统备援能力的一种,当系统中其中一项设备失效而无法运行时,另一项设备即可自动接手原失效系统所执行的工作。)

  以下是专家对话:

  Bigelow: 根据研究表明,集成基础设施增长缓慢,但是您如何看待未来发展,更重要的是,采访者如何使用这些技术?

  Kleyman: 集成基础设施并不算是一个术语,业界人士对此都有不同的看法。 Cisco系统将其称为统一计算系统( UCS)。假设您正在改造虚拟化,可以直接采用这种集成框架,而不是直接采集刀片服务器、1U或2U服务器。这意味着机柜里配有转换设施。集成框架里将刀片服务器集成管理。因此,所有设备均可在同一管理操作。集成框架管理管理系统效果是非常显著的。我们以Cisco UCS Manager为例。如果有20个Cisco 的UCS刀片服务器,管理这些服务器是有难度的。许多硬件制造商都目前做的就是简化流程。管理设备都使用图形用户界面( GUI ),拥有管理权的人可以进入平台查看每个服务器的运行状况和设备状态;可以拷贝硬件配置文件,并出具详细的运行报告,启动时,可以看到服务器上的任何错误,哪怕是DIMM上的错误都可以发现。

  (备注:DIMM:Dual-Inline-Memory-Modules,即双列直插式存储模块。这是在奔腾CPU推出后出现的新型内存条,DIMM提供了64位的数据通道,因此它在奔腾主板上可以单条使用。它有168条引脚,故称为168线内存条。它要比SIMM插槽要长一些,并且它也支持新型的168线EDO-DRAM存储器。)

  就使用而言,会看到集成框架被应用到虚拟化以及平台整合领域上。特别值得一提的是,该集成框架利用大量旧的计算机,并使用V2V或P2V技术,将所有原有计算机设备整合到一个平台上。惠普、思科等几家大制造商正在为IT管理员设计效果显著的解决方案。该方案可以帮助数据中心流程简化,简化带来的意义是深远的。

  (备注:P2V:物理到虚拟,即Physical to virtual ,简称P2V。它是指将操作系统、应用程序或者数据从计算机的物理硬盘中迁移到一个虚拟环境中或是磁盘分区中。P2V可以手工创建或定义一个虚拟环境,并在此环境中安装操作系统、应用程序或者数据。这可能会是一个冗长或不确定的过程,尤其是在一个包含大量旧的硬件条件的新环境中。为了简化操作,会有一些支持全部或者部分虚拟化的自动软件工具,也就是我们所熟识的迁移工具。通常P2V就是创建虚拟的应用服务器环境,如同在苹果上搭建虚拟环境从而运行Windows。

  V2V: 是指把一种虚拟化平台上的虚拟机迁移到另一种虚拟化平台上,RHEV平台中,可以通过virt-v2v工具把ESXI5.0平台上的虚拟机转换成RHEV能使用的虚拟机格式,存放到export区域中(注意:export区域需要是nfs的,能够进行读写)。转换完成之后就可以从export区域中把虚拟机导出,完成虚拟机在虚拟化平台间的迁移。)

  还有另一个原因是,刀片服务器与集成框架随着市场发展价格也会越来越低,不会再因为价格高昂而望而却步。借助Cisco和HP提供的方案,能够获得一个构建良好的集成框架,其中包括机架内转换设备,以及刀片服务器。中型企业不建议考虑考虑这种解决方案,可以一步一步来,初期先购买先期一个机箱,一两台刀片服务器,后期根据需要再进行扩容。由于可扩容的这种方案,未来我们会看到更多的用户采用集成框架,越来越频繁的使用刀片服务器。

  Bigelow: 虚拟化使用范围不断扩容,受访者中有很大一部分是使用虚拟化进行灾难恢复( DR)。您如何看待用户利用虚拟化?

  Kleyman: 令人不可理解的是,还有一些人在采用虚拟化技术时犹豫不决。对于虚拟化的理解,似乎都认为仅靠一台计算机就能虚拟化。事实上,远不是这样。我们现在谈论应用流、桌面流、托管桌面以及虚拟服务器基础架构等,事实上,虚拟化还可以应用在其他很多领域。大部分用户认同虚拟化的优势,最终通过此技术获得更好的性能。例如,您可以通过简单配置对桌面进行虚拟化,利用虚拟化终端最大限度地提高数据传送的效率。

  或者您可以集中地托管整个桌面,并让用户采用“携带自己的计算机”策略,在那里他们可以直接进入自己的笔记本电脑,并能够连接到他们想要的网络上的任何东西。这使数据中心管理更加简化,也正是IT管理人员正在寻找的数据中心管理方式。将单个桌面映射到100个用要比通过CD或使用某种类型的映像软件安装要容易的多。所有的这些通过一套系统进行管理,这就是虚拟化所为我们带来的生活。运行新的虚拟机(VM)总是比运行新硬件要容易。备份特定的虚拟机总比备份硬件要容易得多。

  (备注: 应用流(application streaming)是一个集中的按需软件传送模式,它所利用的原理是,大多数应用程序只需要用它们总程序代码的一小部分就能运行。像渐进式下载视频或音频一样,应用流对最终用户是完全透明的。服务器发送客户端足够的信息来启动应用程序(通常只有应用程序的10%),然后应用流将其余的信息发送到最终用户正在工作的客户端。应用流使用实时流传输协议(RTSP) ,并经常与桌面虚拟化相结合使用。为了传送应用流(application streaming),应用软件都必须打包成4个字节的序列块,这样就可以一次性发送到客户端。)

  在以上这些架构中,DR(灾难恢复)起着更重要的作用。通过利用虚拟化进行DR(灾难恢复),系统可以现在运行的架构中退出来,在完全静止的状态下启动新虚拟机,直到所用用户重新定向到新的主机托管,同时我们仍在启动恢复系统。因此,虚拟化在操作简单以及适应各种平台工发挥着巨大的作用,有助于IT发展。

  (备注:DR:灾难恢复,指自然或人为灾害后,重新启用信息系统的数据、硬件及软件设备,恢复正常商业运作的过程。灾难恢复规划是涵盖面更广的业务连续规划的一部分,其核心即对企业或机构的灾难性风险做出评估、防范,特别是对关键性业务数据、流程予以及时记录、备份、保护。通过允许虚拟机在物理服务器之间进行无缝迁移,虚拟化提供了革命性的灾难恢复计划。)

  Bigelow: 研究表明,物理托管的数量和虚拟机托管数量都在增加。未来对虚拟机扩展以及数据中心全部设备监控管理意味着什么?这会给数据中心管理带来什么问题?

  Kleyman: 我们都听说过台式机扩展、服务器扩展,随着虚拟化的操作简单,未来将会听到更多关于虚拟机扩展的信息。这是一个问题。年轻的管理人员只需通过几次点击,就可以获得新的虚拟机。如果这种情况持续发生, 那么您可能会有50或60个虚拟机在服务器上休眠,资源没有被充分利用,占用过多空间和资源。重要的是管理和监控虚拟基础设施,事实上,管理虚拟环境与管理物理环境同样重要。

  您需要了解这些闲置的虚拟机在平台中起到的作用。把这些闲置的资源一直放在那里就是浪费资源,无论是使用VMware公司的vSphere、Citrix系统的XenServer还是Microsoft的Hyper-V,在GUI(图形用户界面)中都有不同的管理工具,可以了解有多少虚拟机正在运行以及它们的使用情况。

  还有很多其他的工具可以使用。诸如Microsoft的Performance Monitor(性能监视器)或Citrix的EdgeSight等工具,您可以看到设备的性能指标并监视其在终端的使用情况。通过收集这些信息并了解与最终用户进行交互,管理人员能够更好地判断应该运行和不应该运行虚拟机。进入物理主机后,你回看到有8个或9个虚拟机正在运行。你要问问:“这三个虚拟机真的有必要用吗?”有些运维人员会说, “我甚至不知道这三个虚拟机是用来做什么的。”

  这些虚拟机正在占用存储区域网络上的存储,占用网络资源,并占用可以在其他地方分发的有价值的硬件资源。 始终知道虚拟机正在做什么,无论他们是台式机,还是虚拟机应用程序,还是完整的虚拟服务器。让他们在机器上运行只是因为需要它们,需要进行工作,以确保在环境中没有太多的虚拟机扩展。

  Bigelow: 这给我们带来最后一个问题。我们知道,虚拟化正在把重点放在数据中心管理上,但是在哪里看到数据中心管理不足? 系统管理员如何改进他们对管理工具的使用?

  Kleyman: 管理者如何改善数据中心管理工具的使用? 很多时候这些管理工具都存在,只是没有善加利用。 确保监控基础设置完整并设置警报系统。 管理员需要为系统配置工作流程自动化,告诉他们何时需要启动虚拟机。 设置警报也很重要。 很多时候,物理主机负担过重,如果没有设置警报,机器将持续负担过重。 这是数据中心管理工具不正当利用的一个例子。

  重要的是花时间了解虚拟机管理程序或虚拟化平台提供的内容。 很多时候,工程师或顾问将会尽力解释技术,但是内部管理员需要花时间了解他们手上的东西。很显然,他们将会有一些可用的管理工具来为管理者准备虚拟机扩展,机器利用率过高和错误监控。 掌握这些工具可以真正减少数据中心内发生的问题。

★★★ 电脑店行业门户(www.diannaodian.com)独家文章,欢迎大家转载 ★★★