长期以来,空调系统的运行维护管理以 “ 定期 检修 + 报警抢修 ” 模式为主,盲目性高且难以发现隐性故障。通过人工智能的方式可极大提高故障特征的自主辨识,实现全时段智能监控,降低对运维人员专业素养的依赖。因此,本文我们将来探讨下,基于知识数据化表达的制冷空调系统故障诊断方法。
长期以来,空调系统的运行维护管理以 “ 定期 检修 + 报警抢修 ” 模式为主,盲目性高且难以发现隐性故障。通过人工智能的方式可极大提高故障特征的自主辨识,实现全时段智能监控,降低对运维人员专业素养的依赖。因此,本文我们将来探讨下,基于知识数据化表达的制冷空调系统故障诊断方法。
制冷空调系统故障状态的表现形式是热力参数的偏离,这种偏离包含大小和方向两部分。
对于同一种故障而言,不同系统间以及同一系统在不同条件下的特征偏离方向是一致的,不同点在于偏离大小,其受到系统结构、环境条件和运行工况等不同因素的影响。
通过热力学分析、数值仿真、实验测试等手段获得特定系统的故障定性偏离规律,以定性偏离知识表达理论支撑故障诊断,这种规律是模糊的偏离方向和偏离程度 。
因此,本文
提出一种数据随机缩放策略,基于多维偏离矢量生成大量伪数据,用于深度模型训练。
数据随机缩放策略的目的就是使多维偏离矢量各个维度经过等比放大或缩小,实现不同偏离量的模拟。缩放策略的目的是增加矩阵数据的信息熵,以提高深度模型的学习效果。偏离数据是故障模式识别的依据,其主要特征在于偏离方向和偏离大小,对于深度模型而言,相同的偏离方向下不同的偏离幅值对模型分类具有明显影响。不同制冷空调系统由于运行工况、所处环境以及故障严重程度的差异,同一种故障的偏离幅值存在差异,用于训练的数据需要尽可能多地包含不同偏离幅值样本。数据缩放策略就是基于这一思路,对矩阵数据乘以缩放系数后得到放大或缩小的矩阵样本,如式 (1) 所示。
多时间步多维度的偏离数据构成矩阵数据,矩阵数据的所有元素均等比缩放,得到新的样本。这里缩放前的矩阵数据可以是真实偏离矩阵也可以是人工赋值的偏离矢量。通过多个缩放系数对矩阵数据缩放可以得到多组新的矩阵数据,例如利用 0.5 、 0.75 、 1.5 、 2.1 四个缩放系数对同一矩阵数据缩放就可以得到四个新的矩阵数据。
缩放系数在设定的缩放范围内随机取值,而缩放系数的个数取决于诊断模型所需的训练样本数,这通常可以根据神经网络模型的大小而确定,例如训练样本需要包含每类故障 3000 组样本,则在缩放范围内随机生成 3000 个缩放系数。
图 1 是以三类故障为例对缩放策略进行描述,每类故障选取四个特征 ( 蒸发温度 TRE 、冷凝温度 TRC 、吸气温度 T_suc 、排气温度 TR_dis) ,每一行代表一个时间点,每个样本是 6×4 矩阵数据,这里具体数值是根据偏离矢量设定的偏离值,每类故障对应一个偏离矩阵。图 1 中分别为 3 、 0.5 、 1.5 这三个缩放系数生成的三个样本,该样本作为诊断模型的输入。
(
2
)
每个缩放后的数值均添加了一个较小的随机数。
由于真实样本具有一定的不确定性,简单利用缩放系数进行伪样本生成,其效果是不理想的。本文进一步提出对生成样本添加标准正态分布的高斯噪声,丰富数据的信息复杂度,以此提升模型准确性和鲁棒性。
标准正态分布是最符合自然界真实分布的,利用该类噪声可以更好地模拟系统真实扰动。
(1) 真实残差数据本身是有较大随机波动的,单纯的等比缩放与真实情况不符,高斯噪声模拟的是系统的随机扰动,而偏离量模拟的是系统偏离正常工况,二者叠加则表示不同随机扰动下系统均呈现一种固定的偏离模式,而故障诊断的目的就是识别这种模式,使生成分布与真实分布更接近;
(2) 添加噪声实质是添加扰动,这种思路借鉴了神经网络中的 Dropout 层,该网络层通过随机失活部分神经元以实现扰动添加,使神经网络学习过程得到强化,从而有效避免神经网络过拟合,是公认的提升神经网络鲁棒性的方法。
本文借鉴这一思路以添加噪声的方式强化神经网络学习过程,使得模型更加聚焦于偏离规则这种共性特征。同时,噪声的添加强度对诊断结果影响较大,弱噪声起不到模拟扰动的作用,强噪声则会引入过多的干扰从而降低诊断精度,因此,需要实验验证最优的噪声添加强度。
此外,本文还提出随机缩放策略有三个关键的技巧,可以保证其有效实施。
(1) 并不是所有特征都进行缩放,不产生偏离的特征不进行缩放,这些不偏离的特征可以根据故障自身的规律人为指定,如图 1 中红色数据,以避免非偏离参数的误差被放大强化。
(2) 不产生偏离的特征要设置一个小于 1 的值,比如 0.1 ,实验证明这样比 1 的效果好很多。
(3) 缩放系数的生成范围设定非常关键,缩放范围需要考虑目标系统可能出现的严重程度,越严重的故障偏离量越大,而这种偏离量可以根据经验估算。
缩放后的偏离数据的上下限应包含所有故障程度下的偏离范围。例如目标系统可能出现的冷凝温度最大故障偏离小于 5 ℃,最小故障偏离大于 1 ℃,设定的该偏离矢量值为 2 ,则缩放范围需覆盖 (0.5, 2.5) 。由于多维偏离矢量的不同参数缩放范围可能不同,最终的统一缩放范围应取大。经过随机的缩放后,生成的伪数据包含了各类情况下的系统故障信息,以此训练深度模型可以很好地保证其在实际诊断时的适用性。这一过程的实质就是实现了故障诊断知识的数据化表达,其完整的流程见图 2 。
基
于数据化的知识实现完整的制冷空调系统故障诊断流程见图
3
。
使用数据化的知识训练诊断模型,使之得到故障诊断的划分边界,训练完毕的模型用于诊断目 标系统故障类别。
通过偏离特性表征策略,使真实运行数据以偏离残差的形式表征,这种表征形式和数据化的知识形式相同,从而使得诊 断模型可以对其进行诊断分类。
第 1 节中利用随机缩放策略实现了知识数据化表达,生成了带有标记的伪数据,这种生成数据的质量高低决定了训练模型的诊断效果。因此,首先要对生成样本的一致性进行评估,目的是为了获得和真实分布差异最小的生成样本。
对于数据分布的距离评估有很多种方法,如核最大平均差异 (kernel maximum mean discrepancy , MMD) 、瓦瑟斯坦距离 (Wasserstein distance) 和弗雷歇距离 (Fréchet inception distance , FID) 等。其中 MMD 距离最常用于估计两分布差异。在固定的核函数下, MMD 指标用于度量真实分布和生成分布的差异, MMD 值越小,代表两分布差异越小。 MMD 指标可以定义为式 (2) :
生成数据其实质是系统热力参数偏离特征,而目标系统直接采集的运行数据是真实的热力值。如果要使用生成数据训练模型诊断目标系统,则必须将目标系统的数据以偏离特征的形式予以表征。
本课题组前期提出一种基于深度神经网络的制冷空调系统基准模型,该模型融合卷积网络、编 - 解码器、循环神经网络,以数据驱动的方式解决了大滞后、强耦合系统建模困难的问题,模型结构如图 4 所示。
该模型处理时序数据,每个样本包含前置时间段 (t1~tn) 和预测时间段 (tn+1~tn+m) 。并使用卷积网络处理前置时间段数据并输入到编 - 解码器。通过解码器将前置状态信息编码到固定长度的向量并输入到循环神经网络,较好地继承预测时间段开始时刻系统所处的状态。循环神经网络根据每一个时刻的输入变量预测对应时刻的状态变量,最终实现多步状态变量的预测。
统的外界自变参数,包括环境参数、控制参数、负载参数,例如环境温度、压机转速、膨胀阀开度、风机转速等。
系统的因变参数,主要包括系统各类温度、压力等热力参数,通常为故障的敏感特征参数。具体的输入输出变量需要根据数据集确定,本文使用的参数选择方案见 3.1 节。
基准模型利用健康系统采集的运行数据训练,实现健康系统的拟合,属于回归建模问题。由于健康运行数据通常容易获取,因而该训练策略不会限制基准模型的实际应用。
为了保证所有偏离量的含义相同,需要对其去量纲化。这里使用基准模型的每个参数下的误差作为量纲去除的系数,误差可以在验证数据集上通过对基准模型预测值和真实值求平均差得到,例如在健康数据集中基准模型对排气温度的预测误差为 0.5 ℃,则对每个真实的排气温度残差除以 0.5 ,得到统一的去量纲偏离量。
第一步:获取系统的热力基准信息。即得到系统各特征参数健康状态下的理论值,该理论值受到环境、工况、负荷等多因素的共同影响。
第二步:获取敏感特征的残差值。即将第一步获取的基准值和系统实测值做差,得到的差值的实 质是热力偏离量。
第三步:计算残差与基准误差量的比值。基准值获取依赖预测模型,其自身带有一定误差,使得不产生偏离的特征亦会产生较小的残差量,该值可以通过训练数据集计算得到。通过计算残差和误差的比值可以清晰得到偏离倍数,同时对不同量纲实现统一。
本文提出的使用人工生成的偏离参数作为模型的训练数据的方法,诊断实施时同时需要将目标系统的运行数据转化为偏离残差,而不是直接使用实际运行数据。
其主要原因及优势为:
(1) 偏离残差的本质是故障特征,以偏离的形式表征故障可以极大降低数据的复杂度,抵消热力系统自身滞后性和非线性对诊断带来的影响,从而提高诊断精度。该结论在前期研究工作中已证明。
(2) 本文利用生成数据代替真实标记数据以解决标记数据不足的问题,利用故障热力学偏离规律可以生成偏离残差,但却无法生成真实的运行数据。因此,要想实现知识数据化表达,这种数据必须是偏离残差数据。
第 1 节介绍了数据缩放策略以实现知识的数据化表达,随着生成数据量的增多,生成数据分布和真实数据分布的重合度会随之增加,但仍然不会完全重合,这就需要诊断算法具备一定的扩展性。深度神经网络通过多层复杂变换处理样本深层特征,可以较好地对样本分布进行扩展。残差数据是典型的多维时序数据,可以将其认为是一种矩阵数据。
因此,诊断模型使用深度卷积网络搭建,以充分利用其对矩阵数据复杂特征的学习能力,具体结构见表 1 。模型使用生成的伪数据训练,从而解决对真实标记数据的依赖。实施诊断时,将目标系统的数据经过 2.2 节方法转化后输入模型,模型输出即为故障预测类别。矩阵数据的列数等于敏感特征的数量,而行数是截取的时间步长度,通常会根据敏感特征数据选择时间步长度,使其行列数接近。
本文利用 ASHRAE RP-1043 数据集进行实验研究。
项目测试系统为一台制冷量为 90 冷吨 (316.5 kW) 的离心式制冷机组 ( 图 5) ,使用 R134a 制冷工质,机组安装在 70 ℉ (21.1 ℃ ) 的恒温室中。该数据集是一个常用的公开数据集,以此作为实验数据集可以较好地验证提出方法的有效性。
本文选择项目中 6 类故障和 1 类健康数据,每类故障包含 4 种不同严重程度。每种故障不同严重程度的模拟条件见表 2 。
针对这一数据集, Comstock 等对其特征的敏 感程度及其偏离特性进行了研究,选定了 7 个关键 特征用来表征故障,
分别是:蒸发器进出口水温差 (TEI-TEO) 、冷凝器进出口水温差 (TCO-TCI) 、蒸发 器压力 (PRE) 、冷凝器压力 (PRC) 、过冷度 (TRCsub) 、吸 气过热度 (Tshsuc) 、排气过热度 (Tshdis) 。并建立了不同故障下特征参数的偏离矢量表 ( 表 3) ,这一表格就是故障偏离特性的定性知识表达。
本文根据这一知识进行诊断,基准模型的输入输出的变量集。输出变量就是上述 7 个故障特征,而输入变量应该是系统的自变量,包含环境相关变量及控制相关变量,具体包括:蒸发器入水温度、冷凝器入水温度、交互换热器冷凝侧入水温度、交互换热器冷凝侧出水温度、交互换热器蒸发侧入水温度、交互换热器蒸发侧出水温度、外部入水温度、外部出水温度、热水入水温度、热水出水温度、冷凝器水流量、蒸发器水流量、小型蒸汽阀开度、大型蒸汽阀开度、三通阀开度、外部水阀开度。
深度学习算法使用 Tensorflow 和 Python 编程实现,版本分别为 2.6.0 和 3.9.7 ,开发环境为 Pycharm 2018 。 GPU 加速算法使用 CUDA11.2 和 cuDNN8.1 支持库。算法的运行平台为一台图形服务器, GPU 是 NVIDIA GeForce RTX 3080Ti , CPU 是 Intel i9- 11900K ,内存为 64 G ,操作系统是 64 位 Windows 10 。
首先,针对目标系统训练基准模型,进而实现偏离表征,获取后续对比实验所需格式的真实样本。然后,利用 MMD 算法对生成样本和真实样本的一致性进行评估,验证最优数据生成策略。进一步,利用生成数据训练诊断模型并在真实数据集上验证分析,得到最佳诊断策略。最后,与当下主流的监督学习对比,验证提出方法的有效性和优势。
目标系统数据的偏离表征依赖基准模型实现,基准模型的精度决定了表征的准确性。参照图 4 构建基准模型,并利用目标系统的健康运行数据训练,使之可以良好地拟合健康系统动态特性。
基于随机缩放策略的数据生成需要首先进行多维偏离矢量的选值和缩放范围设定。其中,多维偏离矢量选值指的是对不同偏离程度的特征赋予具体的数值,而缩放范围设定则是限制样本随机缩放的上下限。
本文提出对生成数据添加随机噪声的策略,使生成数据与真实数据一致性更佳。噪声的添加效果与添加噪声的幅值有密切关系,噪声太小作用无法体现,而噪声太强会破坏数据原有结构。接下来利用实验方式对不同强度噪声添加以及无噪声添加的生成数据进行样本一致性评估。如表 5 所示,对添加的标准正态分布噪声进行系数相除,得到不同强度的噪声,同时与不添加噪声的生成数据对比。
本节对基于知识数据化的诊断方法进行实验验证,验证数据集来自 ASHRAERP-1043 ,该数据 集细节已在 3.1 节描述。本节结合 4.2 节实验结果, 针对 MMD 值最小的 5 种噪声添加策略和无噪声添加策略进行 6 组对照实验。
最终表明,使用标准正态分布除 0.15 的噪声添加下,训练模型的诊断性能最佳,总体正确率可达 82.67% ,比不添加噪声的诊断精度高 11.64% 。由于实际应用时,这类渐变热力故障并不需要太高的响应速度,完全可以多次诊断后综合决策,因此这一诊断精度已经较好地满足实际应用求。 进一步对最优生成策略下卷积网络的全连接层输出进行可视化处理。
如图 6 所示,分别利用不同严重程度数据进行可视化分析,每种故障 200 组 样本。可以看出, 整体上诊断模型对 7 个类别可以 较好聚类和分离,但仍存在部分故障的空间分布较近,使得相互误诊率较高。
现阶段智能诊断算法以数据驱动的监督学习模式为主。因此,有必要将监督训练模型与本文方法对比研究。
本文对比不同训练数据下的监督学习方法和本文提出方法的诊断精度和自适应性,验证本文方法的优势。本节设置 6 组对比实验,图 7 展示了对比结果。从总体精度上来看,利用知识数据化表达的诊断精度为 82.7% ,这一结果比使用全部数据训练模型的 88.2% 差。
综合可以看出,对比 4 组监督学习,本文提出的方法在最优诊断和最优最差差值上均处于中间水平,结合该方法完全无须标记数据的特性,表明该方法具有替代监督学习算法的潜力,具有明显优势。