项目概述
1.1项目背景与分析
随着信息化程度日益加深,整个社会的业务流程都越来越依赖信息系统,服务器上存储着数量巨大的核心信息,而其运行的也都是重要业务,而作为信息化载体的计算机、服务器等,其“栖身之所”正是机房。那么机房就成为各单位重要的数据处理及运行中心。所以机房管理尤为重要,一旦系统故障没有及时处理,就会造成事故发生,经济损失不可估量。目前许多机房的管理人员不得不采用 24 小时专人值班,定时巡查机房环境设备,这样不仅加重了管理人员的负担,而且更多的时候,安全隐患不能及时排除。目前国内普遍缺乏机房环境设备的专业管理人员,在许多地方的机房不得不安排软件人员或者不太懂机房设备管理甚至根本不懂机房设备维护的人员值班,这对机房的安全运行无疑是一个不利因素。而其中任一系统出现问题均会给数据中心机房带来相应的风险。各个系统又都有如下一些无法避免的情况发生:
机房管理遇到的问题?
1、 UPS与电池管理经常出现哪些问题?
★UPS的逆变器超温、输出负载过载、逆变器故障从而造成UPS转旁路工作,由市电直接给后面的负载如服务器、网络设备等进行供电,而传统的管理方式没有办法及时获取到UPS的工作状况,此时一旦发生市电断电,将会造成服务器、网络设备异常宕机、从而造成网点异常断电的电力事故。
★事实表明50%以上的UPS故障都是电池故障所造成的,UPS的电池容量不足、电池故障、电池电压低从而造成UPS保护关机。电池组是UPS能够持续进行电力供应的保障,电池质量是否稳定是保障UPS正常工作的核心之一,而UPS的电池长时间处于一种浮充状态、小电流放电、短时间放电的供电环境中,UPS的电池极为容易出现异常,而此时一旦市电故障本来可以持续工作4小时的电池,此时只能够工作2小时或者1小时就已经到了电池的截止保护状态(电池电压低),UPS直接关闭输出。然而由于UPS阀控式铅酸蓄电池的特殊密封结构,造成传统的管理方式没有办法及时发现相关问题,而因此无法采取相应的应急措施,继而转变为网点异常断电的电力事故。
★计划性停电:限电、检修、维护、系统改造;故障停电:超负荷、供电线路和设备故障;自然停电:地震、水灾、台风、雷电、火灾。这些问题都会导致市电中断,由电池供电,但无法掌握电池的容量,容易导致电池电量低而导致机器非法关机。
可以把UPS的管理变得轻松吗?
2.配电柜管理的问题?
由于缺乏对配电系统的有效监测,由于负载分配不均导致跳闸甚至短路的电源事故时有发生。能避免跳闸的发生和轻松地完善负载的分配吗?
3.机房环境存在的问题?
传统的管理方式无法获取到环境参数的情况,因此无法为后续对网点的改良提供应有的依据。如何对机房的温度进行有效的监测,成了机房管理员最头痛的问题;如何能远程及时掌握机房环境情况呢?
★ 温度问题
随着负载的不断增加,散热问题日渐成为机房的头号杀手, UPS周边温湿度环境,对UPS的工作效率及工作质量有非常密切的关系。如果UPS的电池长时间工作在高温环境下,将会造成电池的过放情况,造成电池的使用寿命缩短,高温还会造成服务器异常宕机的情况;UPS的电池长时间工作在低温环境下,将会造成电池的放电效率大大下降。而这些问题都将会造成UPS的工作受到影响。我们能及时掌握机房温湿度吗?
★ 湿度问题
由于缺乏对机柜微环境的有效监测,在空气湿度增大时,元器件或由介质材料表面极容易形成的水膜,造成“导电小路”和飞弧现象,从而引起设备故障;而当湿度过低,也就是说越干燥,静电电压会越高,影响电子计算机等设备的正常工作。我们能防止这种问题的发生吗?
★ 漏水问题
漏水问题一直以来都是机房管理人员所忽视的,漏水现象一旦出现,如不及时制止,将会给机房带来不可估量的损失:电路短路、UPS及服务器等关键设备损坏甚至引发火灾。能及时的发现漏水,避免这些问题吗?
★ 空调问题
为解决机房的散热问题而配置的各种空调系统,由于自身缺乏有效的故障自检机制,一旦出现故障,不但起不到散热作用,还可能引发漏水、火灾等一系列的机房事故的发生。能给空调系统一套有效的监控机制吗?
4.消防问题?
烟雾测检是机房火灾预警系统的最后一道防线,无数机房火灾事故血的教训表明,90%以上的火灾事故,都可以通过安装烟感传感器能避免,能减少甚至避免火灾的发生吗?
1.2监控系统概述
针对以上种种问题,我司依据多年来在机房监控管理领域的研发、生产及施工经验,成功推出了全能型一体化机房动环安全卫士“展日保镖1号”。该套解决方案的实施能实现机房一体化管理,从而实现“网络化、智能化、无人化”的科学管理模式,让信息化建设迈上一个新的台阶,让机房的运行更为稳定、可靠,管理更为简单、方便。
监控系统采用先进的B\S架构的动力环境集中监控管理平台、嵌入式网络型并辅以相关的环境采集模块,通过TCP/IP协议方式进行数据传输,实现对该项目机房动力与环境系统进行365*24小时全方位的统一集中监控管理。提供美观友好的监控画面。发现异常系统自动及时弹出报警窗口、并附有多媒体语音广播报警和本地声光进行本地报警,同时通过手机短信、E-mail方式远程通知机房运维人员,以让运维人员及时采取相应措施确保各机房设备的可靠运行。
1.3监控设计理念
我司的全能型一体化机房动环安全卫士“保镖1号”依据“产品化”的设计理念,按照用户选择的品牌型号找到对应UPS,精密空调,配电通讯协议,(可兼容艾默生,施耐德,科华,科士达,易事特等众多品牌的智能设备),高效快捷,无需定制开发。
1.4 监控系统设计原则
根据机房的现实情况和机房物理环境,结合机房宝科技对于机房与UPS动力环境管理监控的最新研究成果和解决方案,提出如下设计原则:
1.4.1先进性、实用性
充分考虑到机房的重要性和高科技的特点,在进行系统设计时,满足了现有基本需求的基础上,考虑到信息技术的发展,我司监控系统设计先进、实用性体现在:所有的动力环境监控产品都是自主研发和制造,简单、易用、产品兼容性好,产品化的系统构成使安装、调试、维护工作变的更加轻松简单;
Ø 本监控系统采用先进的B/S架构,可远程对监控系统进行查看、控制和管理,不需要安装任何客户端软件和第三方插件;
Ø 采用TCP/IP协议方式进行数据传输,支持多种网络传输架构;
Ø 具备大容量锂电池,超长续航能力,外部供电中断之后,还能正常监控报警工作12个小时。
1.4.2高度集成化
一站式采购,只需一台主机,即可轻松搞定机房里的动力环境系统。
1.4.3便捷实用
免工具对插,安装式方便快捷,清晰明了,RJ45标准化功能轻松实现。
1.4.4稳定性、可靠性
Ø 本监控系统符合电磁兼容性和电气隔离性能设计要求,不影响被监控设备的正常工作;
Ø 本监控系统具有自诊断功能,对通信故障、软硬件故障功能能够自动诊断出来并及时告警;
Ø 双网口设计,冗余配置,大幅提升链路可靠性。
1.5.5安全性:
Ø 本监控系统与被监控对象间具有可靠的电气隔离,本系统的软硬件在任何情况下,均不影响被监控对象运行的安全性;
Ø 本监控系统采用最为安全可靠的Linux系统平台,网页服务平台采用最为安全、可靠、高效的Apache WEB+PHP 服务平台,数据库采用了最为先进、高效、安全、可靠的网络数据库Mysql;
Ø 双电源输入设计,监控安全更有保障。
第二章 方案设计与介绍
2.1系统介绍(一)
保镖1号是一款机房动力环境综合网络监控主机,专为中心机房开发的,集UPS监控与扩展动力环境于一身的网络监控主机。该产品采用1U 19英寸机架式设计风格,220V交流供电,更符合现代机房的设计要求。保镖1号提供2路220V交流电的接入,并监控2路220V交流电是否接入、零地电压检测,内置后备电池。实现同时支持对4台主串口设备进行监控(4路UPS,或者2路UPS+2路精密空调等的组合)。支持8路的485扩展设备和智能设备连接接口, 4路USB口可连接语音模块,支持8路开关量输入检测、4路继电器输出控制,内置短信模块,机身带LCD显示和按键输入功能,人机交互界面更为方便直观,极大的满足了中小机房的监控需求,是建设现代无人值守机房的最佳选择。
系统拓扑图如下: