异常检测技术

异常检测技术引言

在软计算领域,智能优化建模技术包括人工智能中的各种主要技术[1],旨在将“原始数据”集转化为商业价值,生成新的业务数据知识。

如今,工业资产之间的连接和信息系统、流程以及操作技术人员的整合[2]是下一代工业管理的核心。基于工业物联网(IoT),公司必须寻求智能优化建模技术(高级分析)[3],以优化决策制定、业务和社会价值。这些技术被更倾向于属于软计算范畴,旨在通过归纳推理像人类一样寻找可能的模式,更少精确但能适应合理变化,并且易于应用和获得[4]。

在本书的这一部分中,将展示在新兴业务流程中使用不同预测分析技术的有趣示例。这些是使用这些新方法和技术能够成功转化为公司利润增长的示例。

在本章中,将介绍火车轴承异常检测过程的基准预测分析示例。所使用的数据是从火车在正常运行条件下通过本地传感器收集而来的。在第11章中,将呈现两个使用这些技术的示例,除了检测系统中的异常外,这些技术还支持评估能源生成损失和设备效率降低的过程。随后在第12章中,将支持更具战略性的解决方案,用于资产健康确定,旨在支持资产再投资的过程。

在大多数情况下,技术基础设施(即传感器和用于数据流向负责相应分析的应用程序的连接)是预先存在的,因此与获得的回报相比,公司对此的投资对业务来说并不是非常重要的。

火车轴承异常检测

在行走系统中,轴承从服务质量和对客户的可用性的角度至关重要。轴承故障可能导致火车停止运行,甚至进入“无用火车”状态,这通常会根据服务的合同条件导致重大经济损失。此外,铁路网络的延误和中断也可能由同一事件引发。

关于轴承,该行业的领先制造商根据一系列考虑因素定制最佳轴承以适应给定的火车型号:径向和轴向载荷、轨道条件、环境和服务类型;车厢和车辆类型;轨距;货物类型;等等。尽管这些系统组成元件的故障率非常低——大多数元件的事故发生率低于每百万公里5x10^-3次(FPMK)——但由于其功能损失的严重性,这些元件中超过50%被认为是关键元件。

在相关文献中,新的贡献正在涌现,开发了基于先进分析的框架,用于监测这些系统的恶化情况,预测其恶化速率,并建议其维护操作的最佳调度,以最大程度地延长预期寿命[7]。这种类型的分析被称为预测性分析(PA),它使用预测模型对数据进行评分,这些模型可以分为回归模型和机器学习(ML)模型,由于变量之间的基本关系往往非常复杂且依赖关系的数学形式未知,本文选择了后者[8]。

计算和通信技术的进步使得大规模自动化数据收集成为可能。然后可以使用实时传感器数据方便地训练和运行预测模型[9]。

企业的数字化转型促进了一种新的运维范式:将从资产和传感器收集的数据与大数据分析相结合,可以监控整个车队,甚至到个别组件,并在需要时计划维护操作[10]。

在许多列车配置中,轴承通过温度、振动或两者条件测量来进行监测。这两种测量方法在技术昂贵的轴承安装中相互补充,效率很高[11]。振动测量对于疲劳损伤分析很方便(例如在点接触或滚珠轴承中)。然而,这些程序在观察润滑情况时使用较少。润滑条件的故障可以通过温度测量可靠地识别。在这些情况下,冲击脉冲的测量对温度传感器的反应明显较不敏感。当轴承发生过热时,可能会损坏座面、滚动面、标签和滚针面,也可能产生保持架损坏和卡死。因此,一旦轴承的恶化被识别出来,就会产生一个问题,即是否需要立即更换,还是可以继续使用轴承直到机器的下一个计划停机。这个问题的答案取决于几个条件[11]:

•载荷:在轻度负载的情况下,恶化进展缓慢,因此可以预期在下一次计划停机时更换轴承。随着负载的增加,恶化传播速度大大加快。

•损伤程度:最初,损伤增长缓慢,但损伤程度的增加也会大大增加传播速度(图10.1)。


正如读者可能猜测到的那样,捕捉轴承温度行为的变化并不是一件容易的任务,这需要具备在列车运行过程中评估正常轴承温度行为的能力,假设一定的负载(取决于列车的重量和速度,以及基础设施的条件)、给定的外部温度和定期润滑。对于精确研究作用在轮对上的力的论文,例如,可以参考Nagumo等人的论文[12],有助于理解对滚动系统轴承的作用力。

在这个案例研究中,考虑的列车配置只有轴承温度监测,其目的是开发一种预测性维护策略,利用这些传感器可以捕捉到异常的轴承温度。

将应用预测分析和大数据处理工具来设计这个策略。其目标是增加列车的预防性维护(PM)间隔、可靠性和可用性。

接下来的章节描述了如何选择机器学习预测模型,用不同的数据集进行训练(在第6章中,已经展示了大数据处理允许测试和接受每个轴承位置的通用模型,而不考虑车轴或车队的复杂性,克服了这些资产非遗传性可能产生的复杂性)。基于这些先进的预测分析的早期故障检测的解释规则与列车车载控制监测系统(TCMS)中已经存在的规则进行了比较,以确保列车的安全。在实施之前对CBM计划的预期性能进行评估,以允许在列车运营过程中进一步对其进行控制。

基线分析选择

基线分析(工业互联网联盟,2015年)用于检测列车轴承温度异常需要选择一个预测模型,并对其进行训练、验证和测试以进行预测。

在这项工作中选择了机器学习模型,因为变量之间的潜在关系预计非常复杂,而且最初对这些依赖关系的数学形式是未知的。可以使用各种机器学习算法选项作为预测模型来进行轴承温度的动态建模[13-16]。以下算法将被介绍,因为它们被考虑用于分析:广义线性模型(GLM)、人工神经网络(ANN)、决策树(DT)、随机森林(RF)、梯度提升树(GBT)和支持向量机(SVM):

决策树(DT)是表示聚类检测的树形结构,可以为一组单一数据生成类规则,或者如Berry和Linoff指出的那样,“可以用来将大量记录划分为逐渐较小的记录集,应用一系列简单的决策规则的结构”[19]。这些模型的最常用名称是分类树或回归树。

随机森林(RF)是在回归和分类问题中使用的有效而直观的模型。它们是直观的,因为它们为结果提供了清晰的路径,并且基于决策树的底层结构。决策树是使用一系列基于变量值的决策创建的模型,以选择其中一条路径。树取决于独立采样的随机向量。森林中所有树的向量都是使用相同的分布进行采样的。随着森林中树的数量增加,森林的泛化误差会收敛。树分类森林的误差取决于森林中各个树的权重以及它们之间的现有相关性。误差、强度和相关性被估计并用于演示对具有更多因素的分割的响应。还使用内部度量来评估变量的重要性[20]。

梯度提升树(GBT)[21]是将增强方法应用于回归树的结果。它计算一系列树,其中每棵连续的树都是从前一棵树的预测残差构建的。在强化算法的每个步骤中,数据被分成两个样本,在每个划分节点中确定最佳分区并计算回归误差。然后,下一棵树被调整以减少误差。这种驱动树提高了单一模型的性能,通过调整多个模型并将它们组合进行预测。为了避免过拟合,将最大的附加树数量设置为200。构建树的子样本比率为0.5,最大层数设置为10。

对算法行为的评估选择了不同的性能指标。这些指标分为两组:与误差相关的指标[平均绝对误差(MAE)、均方根误差(RMSE)、相对误差(MRE)、平方误差(MSE)和相关性],以及与计算时间相关的指标(训练和评分时间)。在接下来的段落中,按照这个顺序介绍每个指标的定义。

平均绝对误差(MAE)的计算基于预测误差,其中预测误差ei是由模型预测值yˆi与实际值yi之间的差异确定的。对于预测或残差误差(ei=yi−yˆi),某个值it的MAE如下所示(参见公式10.1):


个别数据点的误差可能为正或为负,并且可能互相抵消。为了推导模型的整体预测,需要计算绝对误差以汇总所有残差并对其进行平均。这个度量被用来了解准确性。

在某些情况下,用更高的残差惩罚个别点误差是有利的。即使两个模型具有相同的MAE,一个模型可能具有一致的误差,而另一个可能对某些点具有低误差,对其他点则具有高误差。均方根误差(RMSE)对后者进行惩罚。RMSE的计算方式如下(参见公式10.2):


均相对误差(MRE)是预测值与实际值的绝对偏差的平均值除以实际值。该度量用于评估质量,MRE的计算方式如下(参见公式10.3):

均方误差(MRE)是一种估计量,用于衡量误差平方的平均值,即预测值与实际值之间的差异。这种差异是由于随机性或者是因为预测值没有考虑到可能产生更精确估计的信息。均方误差是一种风险函数,对应于二次损失的期望值。其计算方式如下(参见公式10.4):

其中,n表示数据集中的数据点数量。

相关性是衡量两个变量之间关系的统计量,它衡量了一个属性对另一个属性的依赖程度。当两个变量高度相关时,它们的变化速率相同(或者在相反的方向)。变量之间的相关性并不意味着因果关系,也就是说,一个变量并不一定会导致另一个变量的变化。这种相关性由皮尔逊相关系数(r)来衡量,它衡量了线性依赖的强度。两个属性yˆi和yi之间的相关性通过公式(10.5)计算:

关于算法计算时间性能指标,使用了教育版RapidMinerStudio软件(版权归RapidMinerGmbH2001–2019所有)的Automodel选项进行了不同技术的测试。RapidMiner提供了每个算法在每1000行数据上的训练和评分时间,单位为毫秒(ms)。总时间可以考虑为训练时间和评分时间之和。所有算法的实验均在配备I7处理器、8GB内存RAM和64位操作系统的笔记本电脑上进行。

为了在类似的列车运行条件下测试不同模型的性能,选择了几个较短的单列车运行周期,以获得合理的数据提取并测试它们对温度预测的能力。更具体地说,使用的数据是在以下日历时间间隔内获得的:(2016年2月1日至2016年2月3日);(2016年2月3日至2016年2月5日);(2016年2月5日至2016年2月7日);(2016年2月7日至2016年2月9日);以及(2016年2月9日至2016年2月11日)。在这些时间段内,每分钟记录了数据,并且共正确记录了8,265个时间事件,包括以下经过筛选和处理的数据:运行日期和时间、列车速度、轴液压压力、每个轴承的温度(假设每个轴有四个轴承位置:T1、T2、T3和T4)以及外部温度(Ta)。

在训练方面,随机选择了数据的70%用于训练,剩余的30%用于模型验证[22]。不同预测模型的性能结果见表10.1。

性能结果被提供给了机车公司,他们的智能维修工程和新项目部门决定首先选择ANN模型,因为它的相关系数与总时间的比值最好,假设最小要求的相关系数为0.9600。

异常检测模型实施

为了针对每个单个轴承过热故障模式部署一种策略,需要确定故障模式的描述符和检测异常温度行为的解释规则。此外,必须证明新CBM策略实施的好处,为此,在本节中按照以下步骤进行操作:

监测变量的符号表示

描述符的定义

定义TCMS中当前实施的规则

定义可能的新CBM计划的规则

新CBM计划的好处

一旦测试了潜在CBM计划的好处,就可以精确设计CBM计划,确定解释规则的阈值,并计算计划的预期性能,然后进行控制。

考虑到的监测变量如下:

Tat:时间t外部温度。

TSt:时间t列车速度。

Tijt:时间t轴承位置i在轴j上的温度。

描述符是除监测变量外,可能允许跟踪退化进展的额外度量。对于本案例研究,采用以下内容:

T̃ijt:时间t轴j上轴承位置i的预测(ML模型)温度。

AE(Tijt):时间t轴承ij温度预测的绝对误差。

Tmaxj:时间t同一轴承上的最高温度。

其中i=1n表示每个轴上的轴承位置;在我们的案例研究中,n=4。

Tminj:同一轴上四个轴承中的最低温度

μTit:时间t所有轴承温度的平均值,对于所有Ti轴承在列车上:

其中m=列车轴数,在我们的案例研究中,m=21。

σTit:时间t所有T1轴承温度的标准偏差:

当这项工作开始时,一套轴承问题检测规则已经在列车TCMS中实施。实施这些规则的主要原因是为了列车的安全。当系统在列车行驶过程中记录到某种警告信息时,需要进行维护分析,或者列车甚至可能立即停车,一旦紧急回路打开。这些规则包括:

•安全保护规则A.轴承温度差异:

当同一轴上的四个轴承之间的温差大于25摄氏度(Tmaxj-Tminj≥25°C),并且此条件持续超过1分钟时,在PS上显示消息A1并存储。

当同一轴上的四个轴承之间的温差降至25摄氏度以下(Tmaxj-Tminj25°C),消息A1被取消。

当同一轴上的四个轴承之间的温差大于40摄氏度(Tmaxj-Tminj≥40°C),并且此条件持续超过1分钟时,在PS上显示消息A3,并存储在历史记录中,并且紧急回路将打开。

当同一轴上的四个轴承之间的温差降至40摄氏度以下(Tmaxj-Tminj40°C),消息A3被取消,并且回路关闭。

•安全保护规则B.轴承绝对温度规则

当某个轴承的温度达到值Tij≥110°C并且持续超过1分钟时,回路将打开并且列车停止。PS上会显示诊断消息B5,并存储在历史记录中,并且紧急回路将打开。

当某个轴承的温度达到值Tij≥110°C并且持续超过1分钟时,回路会打开并且列车停止。当轴承的温度降至足够低时,Tij110°C会取消消息B5并且回路关闭。

新的预测性维护规则,仅用于预测性维护目的,不直接影响列车控制,具体如下:

•异常轴承温度行为预测规则C.

当轴承温度Tijt超出区间μTit±2·σTit并且持续超过1分钟时,TCMS将记录警告W7。

当TSt≥TSTH1并且AE(Tijt)≥AETHi并且持续时间超过1分钟时,TCMS将记录警告W8。其中AETHi和TSTH1是规则考虑的阈值。

图10.2展示了C规则提供的可能性。这些规则确定的变量是在一次长途列车行程中呈现的,涵盖了6月20日16:00至6月21日18:00的时间段。正如读者可以注意到的那样,没有记录W7警告消息,而从6月20日19:00几乎持续到21日8:00期间将记录W8消息(大致取决于规则的阈值,将在下一节讨论)。没有记录A1、A3或B5消息(事实上,规则A和B远未激活)。这是一个明显的例子,展示了预期C8规则在轴承早期故障检测方面的表现优于C7统计规则,并显示了潜在的改进空间。

这些潜在的早期故障检测改进的性能必须进行测试。为此,完成了以下过程:

数据集选择,包括正常和恶化状态的时期

精确绘制描述符和阈值选择

规则预期性能评估

为了设计CBM计划规则,对列车轴承数据集进行了仔细审查,并由列车OEM工程师和轴承技术人员选择了三个数据集。在这些数据集中,他们确定了轴承在恶化之前处于良好状态的时期、在恶化状态期间以及在预防性更换后再次处于良好状态的时期。在所有情况下,轴承在第一次记录A1消息后尽快被更换。从未记录过A3或B5消息。轴承被更换而不是修复,故障模式描述简单地是“轴承过热”。

结果讨论

C8规则的准确性取决于其阈值数值。绝对误差阈值(AETHi)数值越低,假阳性(错误的异常温度行为)的可能性越高,真阴性的可能性也越高,因此规则的准确性越低,负预测值越高。

当轴承处于良好状态时,图10.3显示了在使用第6章中包含的第一个数据集时预测AE记录中出现的有趣数据。实际上,对于火车的任何速度状态,对于所有的i,AE(Ti,AAt)≤10°C。右侧的图中显示了AE(T1,AAt)的分布,以便观察到这一事实。

当轴承处于退化状态时,图10.4展示了有趣的数据,许多轴承T1点的10°C≤AE(T1,AAt)≤25°C,对于所有的i。为了观察这一事实,右侧图中展示了AE(T1,AAt)的分布。此外,这些点出现在火车的任何速度状态下,但明显在火车速度高于90公里/小时时,密度更高。同一图中还展示了AE(T1,AAt)的分布,以观察这一事实。

为了说明当轴承处于良好状态与当其进入退化状态时AE数据分布的差异,图10.5表示了根据规则C8,对于T1,轴AA在火车TRA期间2和3的温度预测AE分布,其中TSt≥90公里/小时。

在相关文献中,可以找到不同的方法来评估分类系统的性能,其中最常见的之一是混淆矩阵[25],其中精度是正确分类的正例数量与预测的正例数量的比率。它是正预测的正确性的度量。准确性是正确预测的比例(图10.6)。

如上所述,用于数据集中误差估计的记录数量由火车速度阈值固定。然而,所有研究案例表明,如果选择了一个AETH1=10°C的规则,精度表现都很高。

利用图10.5中的数值,构建混淆矩阵,如图10.6所示,并计算预测规则的性能指标。表10.2中以T1轴承为例进行了说明。检查了两个不同的火车速度阈值(10和90公里/小时)下的规则性能差异。

本节最重要的结论是,在规则中选择绝对误差描述符,并将阈值设置为10°C时,无论火车的速度如何,都可以以最高的精确度和特异性预测异常的轴承温度行为。当增加火车速度的阈值达到90公里/小时时,规则的准确性没有显著结果。对于本案例研究,由于这一选项容易实施,最终选择的阈值为:AETH110°C和TSt≥90公里/小时。

一旦选定规则的精度较高,发现的阳性结果(除了异常传感器行为,此情况由TCMS中的其他规则控制)清楚地标志着轴承损坏期的开始。对于所分析的三个数据集,有关这些期间持续时间的信息如图10.7所示,可以看出,在火车TRA的T1轴承中,第2期持续了49.908公里,在火车TRB的T4中持续了108.455公里,在火车TRA的T2中持续了75.526公里。

可以预期,在引入CBM计划后,所获得的受损轴承数据将经过适当筛选,并进一步积累和分析这种类型的数据将有助于开发轴承的剩余寿命(RUL)的精确预测模型(预测)[26]。虽然现在对于轴承的潜在故障至功能故障(P-F)间隔的概率估计还为时过早,但初步结果在将这类轴承的PM间隔延长至30,000公里的可能性方面是令人鼓舞的,而这也是当前业务的需求。请注意,如果检测到受损状态,根据从三个数据集中获得的结果,可以在下一个PM间隔计划进行预防性更换,对火车运营影响极小。

References

ShinYC,XuC(2017)Intelligentsystems:modelling,optimization,,BocaRaton,FL,USA

IIC-IndustrialInternetConsortium(2016)Theindustrialinternetofthings,volumeB01:busi-nessstrategyandinnovationframework(IIC:PUB:B01::PB:20161115).

BartonD,CourtD(2012):78–83

ChauKW(2019)Kwok-wingChauintegr:101.

FayyadUM,Piatetsky-ShapiroG,SmythP(1996)Knowledgediscoveryanddatamining::82–88

ClarkeR(2016)Bigdata,:77–90

KumarM,KPA(2019)

MitchellTM(2006)

BarkeD,ChiuKW(2005)Structuralhealthmonitoringintherailwayindustry:

FerroniF,KlimmekM,AufderheideH,LaiaJ,KlingebielD,DavidichM(2018):Lecturenotesinnetworksandsystems,,pp1003–1013.

(2010)RollingBearingDamageRecognitionofdamageandbearinginspection.(,Eds.)(WL82102/).Industriestrasse1–391074HerzogenaurachGermany:;uid=114073subfilter=app:dc;language-vid:167;language-pub:167;mediatyp-pub:all;referencetyp-pub:0

NagumoY,TanifujiK,ImaiJ(2010),CHen/TransJpnSocMechEngPartC.

HamadacheM,JungJH,ParkJ,YounBD(2019)Acomprehensivereviewofartificialintelligence-basedapproachesforrollingelementbearingPHM:

KouL,QinY,ZhaoX,FuY(2019)Integratingsyntheticminorityoversamplingandg(3):312–325.

LiH,ParikhD,HeQ,QianB,LiZ,FangD,HampapurA(2014)Improvingrailnetworkvelocity:

ShaoH,JiangH,LiX,LiangT(2018)Rollingbearingfaultdete

BasheerIA,HajmeerM(2000)Artificialneuralnetworks:Fundamentals,computing,design,(00)00201-3

ZhangG,EddyPatuwoB,HuY,M.(1998)Forecastingwithartificialneuralnetworks:(97)00044-7

BerryMJA,LinoffG(2004)Dataminingtechniques:formarketing,sales,

BreimanL(2001)(1):5–32.

HillT,LewickiP,LewickiP(2006)Statistics:methodsandapplications:acomprehensivereferenceforscience,industry,

BorovickaT,JirinaM,KordikP,JiriM(2012):Advancesindataminingknowledgediscoveryandapplications.

GuillénAJ,CrespoA,GómezJF,SanzMD(2016)Aframeworkforeffectivemanage-mentofconditionbasedmaintenanceprogr:170–185.

GulledgeT,HiroshigeS,IyerR(2010)

KoutroumbasK,TheodoridisS(2008)Patternrecognition,4

ZhangB,ZhangS,LiW(2019)Bearingperformanc

发布于 2024-11-23
54
目录

    推荐阅读