灰尘堆积导致工控机突发性死机蓝屏怎么办?

内容来源:《仪表问答 案例汇编》第三章DCS工程师站蓝屏死机故障分析及解决方法 184页(书籍详情见文末)

01

基本情况

项目名称:

数控中心于2021年5月20日至2021年6月底搬迁

工况简介:

数控中心搬迁的目的是将东厂、西厂区车间的控制系统(DCS、SIS、GDS)集中搬迁到一处,进行控制及管理。

仪表情况:

控制系统的连接采用光纤和交换机来实现。不同车间的控制系统相同,但软件系统版本不同,操作站、工程师站操作系统不同;交换机型号相同,二、七、十二、十三车间控制系统的网络采用冗余交换机连接。各车间控制系统见下表,交换机的连接布置如图1-1所示。操作台布置如图1.2所示。

 

 

02

故障描述及处理过程

故障前工艺情况:

各装置的操作员站、工程师站运行正常。

故障现象及描述:

在大修期间将数控中心搬迁,搬迁前将各车间控制系统的工程师站、操作员站的计算机主机关机,拔掉A/B网,保存好系统软件加密狗;将各装置的操作员站、工程师站搬到数控中心对应的操作台,进行网络连接等,在对十二车间工程师站的计算机主机上电开机时,工程师站计算机主机出现蓝屏死机故障。其他车间的网络是车间并联后再进行串联,共用这一台工程师站进行编译和下装。

出现蓝屏死机故障,无法进行正常开启。如图1-3所示

图1-3 工程师站蓝屏画面

故障影响范围:

因在大修期间进行搬迁,车间处于停产状态,不影响装置生产。

仪表及系统处理过程:

(1)网络隔离,拔下A/B网络。

(2)计算机除尘、清灰。把计算机主机提到空旷的位置,接上99.999%的压缩空气进行清除表面灰尘,打开计算机主机的机箱用毛刷对其他死角进行清理。在清理的过程中把所有接口按压一遍,防止清灰过程中造成元器件松动。(图1-4)

①灰尘堆积导致工控机蓝屏。工控机可能工作在比较恶劣的工作环境中,长期运行灰尘堆积。灰尘堆积影响硬盘读取,这是造成工控机蓝屏死机的常见原因。

对工控机定期清理灰尘。清灰主要过程是:将工控机有序关机,拔除相应连接;将其提到空旷区域用吹风机或鼓风机吹干净;再用毛刷刷掉芯片上的灰尘,防止开机时因为灰尘堆积影响散热和静电引起干扰等造成器件损坏。

②内存问题导致工控机蓝屏。内存长时间运行,内存资源发生冲突,内存过小加载程序变慢,或者在搬运中内存松动、内存条接触不好等引起工控机蓝屏死机问题。

解决方法是尽量不让多个程序同时运行,安装一些系统必须软件,其它禁止安装、运行,或使用Crtl+Alt+Del将后台不用的一些软件禁掉。

(3)开机系统进入安全模式,系统显示无法进入。

(4)重装Windows2000系统及AdvanTrol-Pro(V2.65.05.00)系统软件。

(5)系统重新开机后运行正常,检查原因为灰尘导致系统蓝屏。

故障性质:

计算机主机长时间运行,未进行维护清理,出现突发性死机蓝屏。

03

故障原因分析

故障前仪表可靠性评价:

计算机主机全年每天24小时持续运行,每天保证生产正常运行,无故障维护。

失效分析:

故障发生后,计算机主机处于停机状态,上电运行前未进行清灰或关机前未对系统进行碎片整理,长时间运行导致垃圾碎片增多。

(1)直接原因:没有进行及时的清灰,灰尘堆积导致线路板短路,无法开启。

(2)间接原因:日常的维护中只看见工控机在正常运行,未进行碎片整理;或者在搬运中内存松动造成。

04

防范措施及建议

经验总结:

由于是偶发的故障,需要定期进行维护,制订检修检查计划,做好备品备件管理,防止出现异常情况无法及时处理。

防范措施:

(1)系统开始使用前,硬盘做镜像备份。

(2)定期对系统进行除尘和杀毒。

(3)减少系统非正常的开关机。

(4)采用USB锁,禁止插入外部存储介质和安装其他软件。

改进建议:

关于电脑主机的死机蓝屏问题,需做好日常的维护,积累问题判断与解决办法。

(1)机柜间及中控室环境应满足《石油化工控制室设计规范》(SH/T 3006—2012)基本要求。

(2)有条件也可以把操作台下的主机集中到环境更好的机柜间机柜中,操作台只留长距离KVM键盘供工操作工操作。

(3)制订预防性维护方案,在不影响生产前提下定期切除主机做预防性维护。

05

知识拓展

(1)计算机主机如果出现黑屏蓝屏死机,处理者要冷静处理,查看是一台计算机故障,还是同时多台出现问题,多台出现问题要考虑是否病毒感染,切记不要随便启动计算机。如果不确定是否病毒感染,建议将计算机主机网线全部拔掉,防止病毒感染其他计算机主机造成全面性瘫痪,此外计算机主机禁止连接外网,以免被病毒感染。

(2)从软件方面,遭到病毒或黑客攻击、注册表中存在错误或损坏、启动时加载程序过多、版本冲突、虚拟内存不足造成系统多任务运算错误、动态链接库文件丢失、过多的字体文件加载、计划任务过多、系统资源产生冲突或资源耗尽都会产生蓝屏。

(3)多系统进行互联时,建议加装隔离网闸或防火墙。如办公网,工控网,监控网之间。

(4)内部元件老化也会出现蓝屏死机的问题,通常风扇是最常见的容易老化出问题的配件,需定期进行润滑,或者更换风扇也可解决此类问题。对于其他配件,可用手触摸,如果触摸后非常地烫手,判定该配件应是有问题,可用好的配件来替代。

(5)硬盘不足或损坏导致电脑主机蓝屏。

碰到系统蓝屏故障时应该进行“磁盘清理”。右击相应盘,然后点击“属性”-“磁盘清理”。

硬盘不足需要进行清理碎片,右击相应盘,然后单击“属性”-“工具”-“优化”-“优化相应盘”,进行简单的维护。

如发现目标硬盘的确有坏道存在,可以尝试对磁盘分区时将坏道隐藏起来或分出去,然后需要重新安装系统软件,这样就能有效解决系统蓝屏故障。

如发现坏道出现在C盘分区中,在重装操作系统时,应尝试将系统安装在其他分区,如安装在D盘,然后更改电脑启动访问盘顺序。

《仪表问答 案例汇编》是聚焦实操、凝练经验的精萃集,是解决“本领恐慌”问题、“能力不足”危险的工具书。书中呈现了近百个自动化仪表典型案例是“仪表圈”数十万深耕于行业内的仪表人的经验与思考。

如何购买《仪表问答 案例汇编》(三)?

点击仪表圈视频号,打开仪表圈小店,

选择商品即可下单

说点什么