资讯动态

基于数据融合的风机故障诊断算法

2026/3/18

来源:《制冷》2025年12月 文章编号:ISSN1005-9180 (2025)06-0071-04

904632abc599c8dfa2b52dcfe6de7b80-sz_2802218.gif

 

王欣怡1, 李婷婷2,喻梦杰1,瞿嘉待1

(1. 南通理工学院基础教学学院,南通,226002; 2.南通理工学院信息工程学院,南通,226002)

 

[摘要]制冷系统是工业设备稳定运行的核心保障,随着工业自动化的不断推进,设备健康状态监测成为现代制造体系中重要的技术组成部分。本文主要检测制冷设备中风机故障,利用风机转速和电流数据,通过以下两种方式检测故障:结合风机电流的特性,拟合出正常风速-电流的三次关系式,并计算出实际数据与正常数据的相似度R;将其正常风速-电流数据绘制成图片,根据哈希值计算实际数据与正常数据的汉明距离。同时融合这两种数据方式,使用随机森林的特征重要性得到R和汉明距离的权重占比,最终得到整体电流相似度,当其小于设定阈值时会触发风机故障预警。实验以冷却塔风机为例,该算法能够有效识别风机故障,从而减少停机时间和维修成本。

[关键词]数据融合;随机森林;故障诊断;冷却塔风机

[中图分类号]   TP277    [文献标志码]   A    doi:10.3969/.ISSN.1005-9180.2025.06.0017

 

Data Fusion-Based Fault Diagnosis Algorithm for Fans

 

WANG Xinyi1, LI Tingting2, YU Mengjie1, QU Jiadai1

(1. School of General Education, Nantong Institute of Technology, Nantong 226002, China;

2. School of Information Engineering, Nantong Institute of Technology, Nantong 226002, China)


Abstract: Refrigeration systems are essential for ensuring the stable operation of industrial equipment. As industrial automation advances, equipment health monitoring has become a crucial part of modern manufacturing systems. This paper focuses on detecting faults in intermal and external fans within refrigeration equipment. By utilizing fan speed and current data, two methods are employed: Combining the characteristics of fan current, a cubic relationship equation for normal wind speed-current is fitted, and the similarity R2 between abnormal data and the fitted curve is calculated. Normal wind speed-current data are converted into images, and the Hamming distance between abnormal and normal data is computed based on hash values. These two data modalities are fused using the feature importance weights from a random forest algorithm to determine the contributions of R2 and Hamming distance, ultimately generating an overall distance metric. When this metric falls below a predefined threshold, fan fault alarms are triggered. Experimental validation using cooling tower fans demonstrates that the proposed algorithm effectively identifies internal and external fan faults, thereby reducing downtime and maintenance costs.

Key words: Data Fusion; Random Forest; Fault Diagnosis; Cooling Tower Fans



 

故障诊断是一种通过监测和分析设备或系统的运行状态,发现并定位潜在或已有的问题,并且保障设备高效稳定运行的技术手段。张宏伟等[1]研究了具有多隐层的多层感知器深度学习结构,用于提取和分析发电厂变频器的过压故障电信号。该故障检测方法容易受到噪声干扰,不同故障之间可能存在相似的特征导致误判,并且处理高采样率信号时计算较为复杂,无法保证实时性的要求。彭白雪等[2]提出了一种基于XGBoosl和SHAP的制冷系统故障诊断方法,通过特征分析和优化,提高故障检测的准确性和可解释性。Abay等[3]提出了一种新的空调故障检测与分类方法,基于人工神经网络和空调功耗数据,准确率达95.1-97.01%,有效预防故障并降低能耗与安全风险。王多[4]等通过逻辑回归算法对地铁风机和水泵的振动信号进行分析,建立了智能故障诊断模型,实现对设备运行状态的自动识别和预测。由于数据情况较多,模型泛化能力下降,导致误差相对较大。刘传洋[5]等给出了基于红外图像的电力设备识别及发热故障诊断方法的研究进展,重点探讨了传统图像处理和深度学习技术的应用。Zheng等[6]利用红外视频数据检测风机的温度故障,基于改进的点渲染红外鼓风机图像的鲁棒分割算法提出了用于分析鼓风机区域温度分布的分层多场景异常检测方法,为解决温度异常给出了合理的方案。图像处理和分析通常需要大量计算资源,尤其是高分辨率图像,处理速度较慢,且成本较高。苗雨阳等[7]通过空调系统运行的特点,建立了动态核主元分析的故障诊断模型。Ruan等[8]针对能源系统故障检测与诊断问题,提出了一种基于深度学习图像识别模型的方法,以解决样本不平衡条件下的故障检测挑战。Kim等[9]利用虚拟传感器和故障影响模型,研究了空调系统中多故障同时发生及传感器成本高的问题。Elmouatamid等[10]运用数据驱动方法,提出了优化传感与测量架构的方案。唐启东等[11]提出一种飞机智能故障诊断系统,通过训练模型快速定位故障类型和位置,显著提升企业处理售后效能。

基于此,本文提出一种基于数据融合的故障诊断方法,通过图像处理技术和数据分析算法,实现对设备运行状态的实时监测和故障预警。


1基本原理

 

从图1可知制冷系统是由压缩机、冷凝器、膨胀阀、蒸发器4大主要器件构成,其中内风机负责将室内空气源源不断地吸人空调内部,促使空气快速流经蒸发器,加速了热交换进程,使得室内热量能够高效地被制冷剂吸收。同时,外风机通过强劲的风力,加速热量从冷凝器向外界环境的散发,确保冷凝器始终处于良好的散热状态。只有冷凝器高效散热,才能保证制冷循环的高效运行,使得制冷剂顺利地从气态转变为液态。因此,内外风机正常协同工作,共同维持空调系统的热平衡与空气流通,是整个制冷循环能够持续稳定运行的重要保障。

 

图1.png

图1制冷系统原理图

 

本文的风机故障检测方法基本步骤如下,流程如图2所示。

(1)数据融合:利用数据拟合出曲线方程和绘制出图片,计算出异常数据和正常数据间的差值哈希相似度(图片),记为d1和相似评价指数R(曲线方程),记为d2

(2)故障值计算:利用随机森林的特征重要性评估确定d1和d2的权重,得到最终的分数值d,并根据数据情况定好阈值t。

(3)故障检测:当d<t时,则检测出内外风机故障;反之说明设备正常。

 

图2.png

图2故障诊断流程图

 

时序信号故障检测模型

 

2.1数据预处理

数据预处理在故障检测中起着关键作用,为后续建模结果的精准度与稳定性奠定了基础。本文采用箱形图分析法,通过计算数据的四分位数和四分位距,有效识别并剔除其中的异常值。绘制箱线图能够直观地展示数据的分布特征和中心趋势,具体步骤如下:

(1)计算四分位数:将数据从小到大排序,计算第一四分位数(Q1,25%位置)、中位数(Q2、50%位置)和第三四分位数(Q3,75%位置)。

(2)计算四分位距(IQR):即IQR= Q3- Q1,表示数据中间50%的范围。

(3)确定异常值范围:将低于Q1-1.5IQR或高于Q3+1.5IQR的数据视为异常值并剔除。

 

2.2图片相似度

图像相似度计算是将复杂的设备运行数据转化为直观的图像特征,并通过图像处理算法量化这些特征的相似性。在设备监测方面,通过比较设备在不同状态下的图像相似度,判断设备有无故障。

均值哈希算法适用于快速计算图片的相似度,将图像转换为固定长度的哈希字符串,并通过汉明距离量化两张图像的相似性。操作步骤如下:

(1)缩放:将图片缩放为像素,保留图像结构,去除细节,以降低图像的分辨率,减少计算复杂度,同时保留图像的主要结构特征。

(2)灰度化:将缩放后的图片转换为灰度图,去除颜色信息,进一步简化图像特征。

(3)计算平均值:计算灰度图每行像素的平均值,作为确定每个像素点阈值的依据。

(4)比较:当每行每个位置的像素点值大于该行像素的平均值时,赋值为“1”;反之,赋值为“0”。接下来将每行的哈希值按照顺序拼接,最终生成由“0”和“1”组成的100位字符串。

(5)对比:计算这两张图像哈希值的汉明距离,即2个100位哈希值不同位的数量,并以此计算图像的相似度,公式如下:

 

公式1.png

 

其中a1,b1分别表示为图片1、图片2的哈希值,n表示图片哈希值的数量,不相同位数越少,设备越正常;反之,则设备异常运行。


2.3 曲线拟合相似度

根据贝兹理论和空气动力学可以知道风速功率与电机转速约为3次方的关系,呈现非线性的趋势,所以利用最小二乘法拟合设备正常数据风速-电流的三次式预测方程能够更好地刻画内在关系,通过计算设备实际数据和预测数据之间的相似度R2从而检测出设备的异常情况。

 

2.3.1最小二乘法拟合

最小二乘法是拟合数据的一种常用方法,核心思路是把预测误差进行平方后相加得到一个总和,使得总和尽可能的小,以此来实现数据的拟合。本文采用三次多项式拟合设备正常数据,具体公式如下:

 

公式2.png

 

其中y表示设备正常数据,x表示时间或其他相关变量。通过最小二乘法,可以求解a、b、c、d,从而得到设备正常运行状态下的预测模型。

 

2.3.2 相似度计算

通过计算设备实际数据和预测数据之间相似评价指数R2检测出设备异常,其公式如下:

 

公式3.png

 

其中y1表示真实值,预测值.jpg表示预测值,真实值.jpg表示真实值的均值。R2值越接近于1,表示实际数据与预测数据的拟合程度越高,设备运行状态越正常。

 

2.4 故障阈值确定

为了确定设备故障的阈值,本文采用随机森林算法计算特征重要性[12-13]。随机森林是一种强大的监督学习算法,属于集成学习方法,利用多棵决策树对数据进行分析。在构建过程中,它通过随机选取样本和特征来降低各决策树之间的关联性,从而增强模型的泛化能力。最终,随机森林综合所有决策树的结果,通过投票或取平均值的方式得出最终预测,有效提升分类与回归任务的精度。本文主要利用随机森林的特征重要性计算d和d,这两个特征的权重,将样本分为正常样本1和异常样本2两类,节点m的Gini指数如下:

 

公式4-7.png

 

则a是最终的分数值,在正常设备和异常设备的数据多次校验基础上,可以定好d的值t。由于d1和d2越大,表示设备出现故障的概率越小,则当d<t时,说明设备出现故障。

 

实验与结果

 

本文采用L公司冷却塔风机的实际数据,利用Python绘制出冷却塔风机转速-电流之间的关系图。首先通过样本库获取2台正常冷却塔和2台异常冷却塔的数据样本;然后借助箱线图对电流数据分区间进行异常值清洗;最后采用数据融合的方式和以下步骤来识别故障。

(1)   图片相似度

冷却塔1、2为故障设备,冷却塔3、4为正常设备,通过图3可以看出异常电流值比正常电流值偏小,正常电流值相对比较接近,根据该性质可以检测出设备的异常。

 

图3.png

图3冷却塔正常与异常电流对比图

 

以冷却塔风机1为例,分别提取正常样本和异常样本(图4),绘制其10x10的图片,并计算得到冷却塔风机1、2、3、4的电流相似度分别为0.81、0.84、0.93、0.96,由此可见,设备出现故障的可能性随着相似度的下降而逐渐增加。

 

图4.png

图4冷却塔1的正异常电流图

 

(2)   曲线拟合相似度分别对4台冷却塔风机风速一正常电流拟合三次多项式,计算其各自的R,以冷却塔风机1为例,如图5所示:

 

图5.png

图5冷却塔风速-电流拟合曲线

 

对4台冷却塔风机的正常电流进行拟合:

 

公式8.png

 

其中x是风速,通过该设备的其他实时数据以及式(3)可得这4台冷却塔风机实际电流和预测电流之间的R2,d2分别为-0.55,-0.23,0.9,0.74,冷却塔1、2为故障设备,冷却塔3、4为正常设备,由此看出冷却塔风机发生故障时,d2越小,与正常电流相似程度越低。

(3)   决策树特征重要性

在式(7)的基础上,可得d1和d2的特征重要性为0.72和0.28,则最终分数值d=0.72d,+0.28d2,即4台冷却塔风机的值分别为0.42,0.54,0.92,0.89。因此,设定故障阈值为0.8,当d值小于0.8时,则说明冷却塔的风机存在故障,反之,设备正常。

 

结论

 

本文通过数据预处理、图像相似度计算、曲线拟合相似度分析以及随机森林确定故障阈值,提出了一种新的风机故障诊断算法。将数据和图片融合应用能够减小降低模型的误差。利用随机森林特征重要性确定2种方式的权重占比,结合2个方法的优点,更加精准地诊断故障,同时减少设置2个阈值的复杂度,为检测制冷设备中内外风机故障提供了新的思路和方法。

 

 

参考文献:

[1]张宏伟,吕雪霞.基于深度学习的发电厂变频器过压故障检测[J].电子设计工程,2021,29(5):71-74+79.

[2]彭白雪等.基于XGBoost和SHAP的制冷系统故障分析[J].低温与超导,2024,52(7):89-96.

[3] ABAY C, APAYDIN 0ZKAN H. Artificial neural networkbased fault detection and classification method for airconditioners [ J] . Eskisehir Technical UniversityJournal of Science and Technology A, 2024, 25 (2): 240-249.

[4]王多,韩露.基于逻辑回归分类算法的地铁风机及水泵智能运维研究[J].智能建筑与智慧城市,2024,(12):157-159.

[5]刘传洋,吴一全.基于红外图像的电力设备识别及发热故障诊断方法研究进展[J].中国电机工程学报,2025,45 (6),2171-2196.

[6] ZHENG S Y, LI L, CHU N, et al. Abnormal temperature detection of blower components based on infrared video images analysis [J]. IEEE Sensors Journal, 2024, 24 (2):1919-1928.

[7]苗雨阳,刘成刚.空调系统传感器自动故障诊断方法研究[J].机械设计与制造,2020,(7):161-164+169.

[8] RUAN Y J, ZHENG M H, QIAN F Y, et al. Fault detection and diagnosis of energy system based on deep learning image recognition model under the condition of imbalanced samples [J]. Applied Thermal Engineering, 2024,238:122051.

[ 9] KIM W, LEE J H. Fault detection and diagnostics analysis of air conditioners using virtual sensors [ J].Applied Thermal Engineering, 2021, 191: 116848.

[10] ELMOUATAMID A, FRICKE B, SUN J, et al. Air conditioning systems fault detection and diagnosis-based sensing and data-driven approaches [ J].Energies, 2023,16(12):4721.

[11]唐启东等.基于深度学习的飞机故障诊断系统关键技术究[J].航空维修与工程,2018,(10):54-57.

[12] BREIMAN L. Random Forests [J]. Machine Leaming,2001,45 (1):5-32.

[ 13 ] LIAW A, WIENER M. Classification and regression by randomForest [J]. R News, 2002, 2 (3): 18-22.


返回上一页