基于网络回溯分析技术的SCADA系统故障诊断方案分析

所属分类: 网络 / 疑难 阅读数: 952
收藏 0 赞 0 分享

  什么是回溯分析

  回溯分析是追踪决策的特性之一。 是指对原始决策的产生机制、决策内容、主客观环境等进行分析.从起点开始,按顺序考察导致决策失误的原因、问题的性质、失误的程度等。

  案例场景

某排水集团在线业务区的SCADA系统需要从DMZ区的I/O Server上采集数据,SCADA系统使用某些IP能够正常从I/O Server采集数据,但是另一部分IP则不能正常的从I/O Server上采集数据,提示异常并且断开连接。

例如:10.2.103.8为SCADA系统的IP地址,能够正常的从10.2.0.51和10.2.0.52的I/O Server上采集数据,但是将SCADA系统的IP改为:10.2.103.10,则不能正常从10.2.0.51和10.2.0.52的I/O Server上采集数据。

案例分析

网络拓扑图(简化)

下图为简化拓扑图,我们展示SCADA系统和I/O Server之间的通讯链路,分别在靠近SCADA系统和I/O Server的接入交换机上采用端口镜像的方式旁路部署科来网络回溯分析系统,采集SCADA系统和I/O Server之间的通讯数据包。



图1网络拓扑图

故障排查

我们从DMZ区的交互机和在线业务区交互机上同时采集通讯数据,进行对比分析,来看看具体是什么原因造成了业务系统的故障。

DMZ区交换机数据

在DMZ区交换机数据中可以看到TCP会话中10.2.103.10向10.2.0.52发送了大量的RST(复位)数据包,如下图2所示。这些连接被这些复位数据包释放掉了,但是为什么会存在这么多的复位数据包?又是谁发送了这些数据包?



图2 DMZ区捕获到的TCP会话

通过查看科来网络回溯分析系统的交易时序图,可以发现复位数据包的TTL(生存时间)值是127.而正常时传输的数据,可以看到TTL(生存时间)值为61,和异常时明显不同,说明复位数据包并不是从10.2.103.10发出来的,而是有个中间设备发送了复位数据包中断了正常的应用会话。

正常会话的TTLTTL值为61,而异常复位数据包的TTLTTL值为127.结合该集团的拓扑图来看,正常会话发送初始TTLTTL值为64,经过2台防火墙和1台核心交换机后抓取到的TTLTTL值为61,而异常复位数据包初始TTLTTL值为128,只经过了DMZ区连接的防火墙,TTLTTL值减为127,说明复位数据包极有可能是某上网行为管理设备发送的。

在线业务区交换机数据

我们在在线业务区交换机上抓取数据,找到同一个TCP会话。如下图3所示:



图3在线业务区捕获到的TCP会话

可以看到该会话中同样存在了大量的复位数据包,但与DMZ区不同的是,复位数据包是由10.2.0.52发送的。

同样查看科来网络回溯分析系统的交易时序图,可以看到复位数据包的TTL(生存时间)值是126.而正常时传输的数据,可以看到TTL(生存时间)值为125,和异常时明显不同,同样说明了复位数据包并不是从10.2.0.52发出来的,而是有个中间设备发送了复位数据包中断了正常的应用会话。

正常会话的TTL值为125,而异常复位数据包的TTL值为126.结合该集团的拓扑图来看,正常会话发送初始TTL值为128,经过2台防火墙和1台核心交换机后抓取到的TTL值为125,而异常复位数据包初始TTL值为128,抓取到的TTL值却为126,说明数据包只经过了核心交换机和在线业务区区连接的防火墙,说明复位数据包极有可能是某上网行为管理设备发送的。

结论及处理结果

结合DMZ区与在线业务区捕获的数据包分析来看,在正常的通讯过程中DMZ区与在线业务区之间的设备发送了RST(复位)数据包,释放了正常的会话,造成了SCADA系统不能正常从DMZ区的I/O Server上提取数据。根据数据包的解码分析,可以确定发送异常复位数据包的设备为某上网行为管理设备,通过对该设备策略的修改,10.2.103.10能够正常的从I/O Server上提取数据,未发生异常情况。

以上就是SCADA系统故障诊断方案分析,结合DMZ区与在线业务区捕获的数据包分析来看,在正常的通讯过程中DMZ区与在线业务区之间的设备发送了RST(复位)数据包,释放了正常的会话,造成了SCADA系统不能正常从DMZ区的I/O Server上提取数据,谢谢大家阅读,希望能帮到大家。

更多精彩内容其他人还在看

怎么解决无线网间歇性掉线问题

很多用户反馈这个问题,期初我们也认为就是驱动的问题,随着研究的深入发现这也很可能是由于无线网卡和路由器之间的PSPM模式不兼容产生的。
收藏 0 赞 0 分享

无线网络容易掉线的原因和解决方法

这篇文章主要介绍了无线网络容易掉线的原因和解决方法,本文剖析了无线网经常掉线的一些原因,并给出相应的解决方法,的朋友可以参考下
收藏 0 赞 0 分享

宽带连接错误代码678介绍、产生原因和解决方法

最近帮朋友家里看网时,上网拨号出现宽带错误代码678,当时咨询电信客服电话,可是他们只给我一个不能上网的回复,没办法,小编只好自己解决了,并总结成本文分享给大家,需要的朋友可以参考下
收藏 0 赞 0 分享

ADSL经常断流与断线的问题分析与解决方案

什么是ADSL的断流问题呢?通常是用ADSL MODEM能成功拨号登陆,但上网的时候数据流传输突然中断,时不时的能连上网,下面跟随脚本之家的小编一起来了解一下ADSL经常断线的原因和解决方法
收藏 0 赞 0 分享

局域网故障排除经验之谈 网卡故障居多

本文是笔者根据自己的经验谈排除局域网故障,网络故障可分为硬件故障和软件故障两大类。关于局域网的软件问题引起网络故障的例子很多,但多数集中在网卡的设置上,需要的朋友可以参考下
收藏 0 赞 0 分享

家庭局域网故障之电脑网线插口灯不亮的的解决办法

本文所研究的内容就是要解决 组建家庭局域网所带来的一系列问题。搭建家庭局域网不难,想要一次调通可不是那么轻易。不过,难者不会,会者不难,把握了下面这些小技巧,你就可以轻松解决网络软硬故障了。
收藏 0 赞 0 分享

解决宽带路由器无法上网和网速不稳的办法

有用户反映在接上路由器之后,感觉电脑的上网速度变慢了,却又找不到问题的症结所在,无法解决。下面就介绍下遇到此问题的一般处理方法
收藏 0 赞 0 分享

Win98局域网网上邻居找不到自己电脑的解决办法

这篇文章主要为大家介绍了局域网上使用Win98作操作系统的客户机,有时候会出现“网上邻居”找不到本机的怪现象,具体解决办法如下文,需要的朋友可以参考下
收藏 0 赞 0 分享

SDN与交换机怎么实现通信 需达成什么“协议”

怎样实现SDN与交换机通信?为了解决这个问题,目前有许多供应商正在开发开放传输交换机,它们将充当SDN控制器和光纤传输交换机之间的中介,需要的朋友可以参考下
收藏 0 赞 0 分享

遇到传统SLAAC地址的主动主机跟踪的问题该怎么解决?

这篇文章主要为大家介绍了如何对抗传统SLAAC地址的主动主机跟踪?以及对抗主动主机跟踪的方法和工具,需要的朋友可以参考下
收藏 0 赞 0 分享
查看更多