网站地图 | 产品中心 | 联系我们 欢迎您的光临!我们竭诚为您服务!真诚沟通!互动双赢!

咨询热线

18011863066

服务器运行过程中如何进行维护
时间: 2018-08-02 14:12  来源: 未知  作者: 昊群计算机

  随着公司业务的增长,服务器的数据越来越多,即使是拥有高性能和冗余功能的服务器,增加的工作负载整合与可靠性期待,也能让服务器忙得不开交。那么就需要对服务器进行维护,为服务器列出维护清单,包括物理配件与系统关键配置。
 

  如何对运行中的服务器进行维护?
 

  1、检查事件日志输出

  服务器事件日志中记录着丰富的信息,需要网管员仔细审查系统日志、恶意软件日志和其他日志。在维护服务器时要检查报告设置,并验证告警与告警接收人地址是否正确,如果有技术人员离开服务器组,就要更新服务器的报告系统。双重检查联系名单和联系方式也同样重要,只将错误报告发送到技术人员邮箱是不够的,要确保在非工作时间也要联系上。

  主动分析日志数据。当发现慢性或反复出现的问题时,要主动寻找解决问题的方案,以免问题升级。如果服务器日志显示一些内存模块可恢复报告,虽然不会触发严重告警,但是说明了某个模块存在问题,技术人员需进行更详细的诊断程序以识别即将发生的故障。

  如果问题影响轻微,无须关闭服务器,可继续服务,直至需要更换硬件。
 

  2、检查本地硬盘

  很多服务器都依赖内部硬盘用来承载工作量和存储,保存用户数据等。如果硬盘介质出现问题会严重影响负载的性能和稳定性,最终导致硬盘故障。

  磁盘介质常见的问题包括坏道和碎片化。RAID能够确保磁盘出现故障时,保证数据稳定性与一致性,但是小型的服务器(如1U的服务器)可能无法提供足够的空间来实施。如使用CHKDSK(Check Disk)工具来检查磁盘的完整性,还可以修复其中损坏的扇区。
 

  3、定期安装补丁与更新

  服务器软件栈BIOS、操作系统、虚拟机管理程序、驱动程序、应用程序、支持工具,必须确保能够互动与写作。但是,软件代码很难做到不出现问题,这类软件问题需要通过修补或更新,来修复错误、提高安全性、简化操作性、提高性能。

  并不是所有软件都能自动更新,管理员要确认那些补丁和升级是必要的,再评估和测试更新结果。软件开发者无法测试出每个软硬件的兼容性、补丁以及更新存在的问题,因此可能会发生一些无法预料的问题。

  转换到DevOps后,在频繁的更新过程中可能加剧潜在的问题。在部署之前要在实验室环境内测试补丁或更新,确保可以撤销原来的更改,并恢复修改前的软件配置。
 

  4、确保服务器可以呼吸

  检查服务器内部和外部的空气流动路径,清除灰尘和杂物,保证冷却空气通行顺畅。防静电工作区要用清洁、干燥的压缩空气去除灰尘和碎屑。

  灰尘和空气中流动的障碍物会导致服务器更加耗电,长时间的沉淀会导致某些组件过早出现故障,因此服务器的除尘工作是必不可少的。
 

  5、坚持例行维护

  日常的服务器维护,可以更好的防止问题的发生。维护的频率取决于设备的年龄、数据中心环境、服务器的容量等因素,如放置在设备间的旧设备比放置在配有HEPA过滤器、良好冷却设施数据中心里的设备更需要频繁的检查。

  使用虚拟化服务器进行工作负载迁移,替代中断时间是个好方法,这样每当服务器维护时,应用程序是安全的。

  数据中心服务器需要定期维护才能保持最佳的状态,执行简单的维护操作,能够延长服务器寿命。