中自网

热门搜索:PID  plc  传感器  电机  变频器  工业以太网  无线通讯  低压 

当前位置:首页>>应用案例首页>>专业论文>>正文

基于MLKFE-LSTM的滚动轴承电流信号故障诊断

发布日期:2025-03-14   来源:变频器世界   浏览次数:1095
分享到:
【摘   要】:提出了一种基于多尺度大核特征提取和长短时记忆网络的故障诊断方法(MLKFE-LSTM)。为充分挖掘原始电流信号中的多尺度信息,设计了多尺度大核特征提取模块(MLKFE),旨在提取长时依赖特征与细粒度特征,从而有效捕获上下文信息。基于学习到的特征,综合考虑效率与性能,采用长短时记忆网络(LSTM)进行故障类型的识别。为验证所提方法的有效性,在PU数据集上进行了实验测试。实验结果表明,该方法能够有效识别滚动轴承故障类别,分类结果的准确率、召回率及F1分数分别达到了99.75%、99.85%和97.75%。这些

 

曾胜亮,吴祉汐

华中科技大学

摘要:提出了一种基于多尺度大核特征提取长短时记忆网络的故障诊断方法MLKFE-LSTM)。为充分挖掘原始电流信号中的多尺度信息,设计了多尺度大核特征提取模块(MLKFE),旨在提取长时依赖特征与细粒度特征,从而有效捕获上下文信息。基于学习到的特征,综合考虑效率与性能,采用长短时记忆网络(LSTM)进行故障类型的识别。为验证所提方法的有效性,在PU数据集上进行了实验测试。实验结果表明,该方法能够有效识别滚动轴承故障类别,分类结果的准确率、召回率及F1分数分别达到了99.75%99.85%97.75%。这些结果表明,所提方法在滚动轴承故障诊断中具有良好的应用前景。

关键词:轴承故障检测;电流信号;多尺度特征提取;LSTM

AbstractA fault diagnosis method based on multi-scale large-kernel feature extraction and long short-term memory network (MLKFE-LSTM) is proposed. In order to fully mine the multi-scale information in the original current signal, a multi-scale large-kernel feature extraction module (MLKFE) is designed to extract long-term dependent features and fine-grained features, thereby effectively capturing contextual information. Based on the learned features, considering both efficiency and performance, a long short-term memory network (LSTM) is used for fault type recognition. To verify the effectiveness of the proposed method, experiments were conducted on the PU dataset. The experimental results show that the method can effectively identify the fault categories of rolling bearings, with the accuracy, recall and F1 score of the classification results reaching 99.75%, 99.85% and 97.75% respectively. These results indicate that the proposed method has a good application prospect in rolling bearing fault diagnosis.

KeywordsBearing fault detection; Current signal; Multi-scale feature extraction; LSTM

引言

滚动轴承是机械生产、钢铁冶炼、航天航空、风力发电和石油化工等领域中旋转机械的重要基础零部件,其微小故障甚至可能对整个机械系统造成严重影响。据调查,约40%的电机故障是由轴承失效引起的[1]。在轴承发生早期故障时,故障特征信息通常较为微弱,同时电机正常工况下转速波动大、噪声含量高,这使得在变转速工况下提取故障特征信息变得困难。因此,实现对轴承早期故障的准确识别及预警,不仅可以有效防止机械系统的意外停机,还对设备的维护和企业的安全生产具有重要意义。

传统的故障诊断方法从轴承故障对电机信号的影响机理出发,通过在时域、频域或时频域提取故障特征,进而实现故障状态的识别。但在电机处于非稳态工况时,诊断效果常常不理想,且由于谐波分量和负载波动等因素,传统基于电流信号的故障诊断性能受限。随着机器学习技术在工业界和学术界的广泛成功,端到端的深度学习方法能够直接将原始电机数据作为输入,通过多层网络模型逐层学习数据特征,进而实现故障特征的有效提取与分类,为电机轴承故障的智能诊断提供了新思路。

本文提出了一种基于多尺度大核特征提取MLKFE与长短时记忆网络(LSTM)的故障诊断方法,主要工作与创新点如下:

(1) 所提方法基于电流信号进行故障诊断,无需额外的信息支持。相较于振动信号的采集需要额外的振动传感器,并且受到安装位置和方式的影响,电流信号作为驱动系统的固有信号,使得基于电流信号的诊断方法在实用性上具备明显优势。

(2) 提出了多尺度大核特征提取模块,该模块能够有效提取长时依赖特征与必要的细粒度特征,从而有效捕获上下文信息,获得更为丰富的特征表达,提高了故障诊断的性能。

(3) 结合效率与性能,引入LSTM进行故障类型分类,能够更好地捕捉序列数据中的长期依赖关系和时序特征,从而优化多工况下轴承故障的检测能力。

2理论背景

2.1大核特征提取

在故障诊断领域,实现高效特征提取以获得强大的特征表示是核心挑战之一。卷积神经网络(CNN)通过利用局部上下文信息及平移不变性,显著增强了神经网络在特征提取方面的能力。自AlexNet [2]的提出以来,卷积神经网络迅速成为图像分类特征提取的主流框架。大尺寸卷积核(如7×7或9×9提取细节特征方面表现更为出色,而小尺寸卷积核(如3×35×5)则更多地关注边缘结构信息。然而,引入大尺寸卷积核必然会增加网络的参数数量。

针对这一问题,文献[3]提出一种基于大核注意力(LKA的卷积神经网络方法,该方法将一个K×K卷积操作分解为一个 [(K/d)×(K/d)]扩张卷积、一个[(2d-1)×(2d-1)]深度卷积和一个1×1卷积(其中K卷积核大小,d扩张)。通过这种分解方法,不仅能够有效提取长时依赖特征,还显著减少了训练参数的数量,同时通过深度卷积与扩张卷积的结合,实现局部上下文与全局上下文的信息融合,从而提高故障特征提取的效果。

2.2长短期记忆网络LSTM

长短期记忆网络(LSTM)是对传统递归神经网络(RNN)的改进,旨在更有效地捕捉输入数据的全部历史信息。LSTM通过引入输入门、输出门和遗忘门来解决RNN在训练过程中可能出现的梯度消失或梯度爆炸问题。在每个时间步,LSTM神经元输出一个状态响应列表,该列表包含先前输出的信息和当前输入的信息,这种设计有效克服了训练过程中梯度消失效应所带来的困难。LSTM的核心在于其特有的记忆单元结构。一个基本的LSTM单元包含三个主要的门控机制:输入门、遗忘门和输出门。这些门控机制通过控制信息的流入、流出和保留来管理所需的状态信息。

输入遗忘门、输出、单元格状态和隐藏门更新可以表示如下

                                                                               

                                                        

其中,是前一时间步的隐藏状态,是当前输入,bW分别代表偏置和权重。在第t个更新步骤中,通过输入和隐藏状态来更新输入门遗忘、输出门单元状态隐藏门状态

所提方法

3.1问题定义

在本文中,所获取的电流信号实质上是等时间间隔采样形成的长度为T的一维时间序列,表示为。故障分类的目标是确定某一个时间观测点的故障类别。数据集构成的集合,其中是与对应的标签向量。对于包含K的数据集,标签向量长度为K的向量。的任务在数据集D上训练分类器,以实现从可能的输入空间映射到类变量值(标签)的概率分布。

3.2数据预处理

为了进一步提取有用信息,帮助模型更好地学习和预测。首先采用滑动窗口技术创建时间序列数据在数据序列上定义一个固定大小的窗口并进行移动,从而提取出多个子序列。这一过程不仅可以增加模型的训练样本数量,还增强模型对时间依赖特征的理解。

其次,为提升模型的收敛速度及精度,对每一个滑动窗口生成的子序列进行短时傅里叶变换(STFT),计算其频域表示。频谱图不仅能够保留时间序列数据的性质,能突出频率特征,这将有助于在深度学习网络的卷积层中更有效地分离特征从而使模型能够更好地捕捉到潜在的模式和规律。

3.3多尺度大核特征提取器

文献[3]虽然已证明大核注意力(LKA在捕获长范围依赖性方面的有效性,但在应用于轴承故障问题时,却面临一定挑战。轴承故障数据本身具有噪声大、多样性和复杂性等特点,而LKA的固定配置难适应不同规模的特征,阻碍了同时捕获精确故障检测所必需的细粒度细节和更广泛的上下文信息的能力。基于这局限性,提出了一多尺度大核特征提取器MLKFE模块,旨在提取多尺度特征并捕获谱图图像的显著细节。MLKFE模块的体系结构如图1所示。

 

1  MLKFE网络模型

其中,残差大核注意力(ResLKA)模块用深度卷积(DW)、扩张卷积(DDW)和逐点卷积(PW)来近似大内核卷积,以学习两种长程像素关系。与文献[3]中提出的方法不同,ResLKA利用小的卷积核尺寸作为残差连接的深度卷积,从而使模型能够捕获更多关于短程像素关系的信息。此外,ResLKA中的残差连接有效防止梯度消失的问题。ResLKA数学表达式如下:

  (6)

通过对不同核尺寸和膨胀率的多个ResLKA模块生成的特征进行融合,可以实现多尺度特征的合。同时,原始谱图像不直接馈送到多尺度ResLKA模块以提取特征,而是利用几个简单的卷积层(由二维卷积最大池化归一化GELU激活函数组成)来提取图像的更高级细节。这种设计增强模型的整体性能使其能够从频谱图像的各种频率表示中提取重要信息,从而进一步提升故障分类的准确性和鲁棒性。

 

2  MLKFE-LSTM网络模型

3.4 MLKFE-LSTM框架

模型的总体流程如图2所示。第一部分是特征提取。首先使用短时傅立叶变换(STFT)将数据集的原始信号转换为频谱图。这一过程有助于在深度学习网络的卷积层中更有效地分离特征。接下来,提出多尺度大核特征提取器MLKFE)用于从频谱图中提取特征。

第二个模块分类器,包括一个分层的长短期记忆网络(LSTM和全连接层,用于构建输入输出之间的复杂非线性模型。2所示,LSTM_1隐藏状态为LSTM_2提供输入,LTSM_2输出馈入全连接层进行分类。输入被分为若干步骤送LSTM网络。当前步骤的输出受到一步骤输出的影响这种设计使得LSTM网络能够有效利用时序信号的特,充分提取电流信号的内部特征。最后,函数将神经元输出转换为10滚动轴承健康状态的概率分布。函数描述如下

              (7)

其中z表示第j个神经元的输出。

实验

4.1实验数据集

 

3  PU实验台结构

滚柱轴承作为重要的旋转机械部件,其工作状态的及时、准确诊断至关重要采用德国帕德恩大学提供的轴承数据集(PU[4],以验证所提出的MLKFE-LSTM框架。试验台的设置如图5所示。试验台由五个主要部件组成电动机、扭矩测量轴、轴承测试模块、飞轮和负载电机。

PU数据集涵盖了由电机操作引起的人为和真实故障,能够更好地反映实际应用场景。从作者提供的32个标签中随机取了10个标签,具体信息如表1所示。其中,故障标记一半人为故障,另一半真实故障。故障的严重性级别也被列出,其中1表示缺陷长度小于2 mm2表示缺陷长度在2 mm4.5mm之间,而3表示缺陷长度4.513.5mm之间。为了验证模型在多种情况下的有效性,从同相位的电流信号中提取样本,利用步长2048的不重叠滑动窗口来创建样本,最终随机选择16000个样本进行实验

故障位置

故障原因

严重级别

故障种类

轴承代号

标签

健康

 

 

 

K001

0

外环

放电加工

1

人为

KA01

1

外环

电动雕刻

2

人为

KA03

2

外环

点蚀

1

真实

KA04

3

外环

钻孔

1

人为

KA07

4

外环

塑性形变

1

真实

KA15

5

内环

放电加工

2

人为

KI01

6

内环

电动雕刻

1

人为

KI03

7

内环

点蚀

1

真实

KI04

8

内环

点蚀

3

真实

KI16

9

1  实验选取轴承列表

4.2细节设置

对于模型设置:建议模型的MLKFE设置中包含三个卷积维数为64resLKA模块。每个模块的核大小和扩展速率参数分别是(72)、(113)和(154)。在训练过程中,为防止LSTM_2之后的过拟合,dropout技术。同时,使用交叉熵函数(CE作为损失函数来评估网络性能,并通过反向传播来更新权重。考虑到初始权重和偏置设置对网络结果影响,进行10次独立实验,以减少初始选择对分类精度的影响。学习率最初设置为0.001,每10轮次减半。实验在锐龙7000系列 CPU64G RAM的环境下运行50个轮次,训练时间约为5分钟。

为验证模型性能使用准确率(Ac)、精确率(Pr)、召回率(Re)F1分数作为评价指标。具体计算公式如下:

其中TPFPFNTN分别代表真阳性、假阳性、假阴性和真阴性结果的数量。

4.3实验结果与分析

 

4  准确率及损失函数

经过短时傅里叶(STFT)处理后,原始数据转换化频谱图像,每个轴承的样本数据结构为 64×64。根据表3列出的10个轴承类别,其中 1 个为正常轴承,9 个为故障轴承。训练过程中,随机选择11200个样本进行训练,训练后网络模型的准确率以及损失函数如图 4 所示。可以观察到,模型的准确率随着训练轮次的增加逐渐提高,并稳定在 99.5%左右;损失值也逐渐稳定在 0.017 左右。

为测试模型的准确度,剩余4800 个样本被用作测试集,诊断结果的混淆矩阵如图 5 所示。图 5 中,横坐标表示由MLKFE-LSTM网络诊断出的状态类别,纵坐标代表轴承真实的状态,方格的颜色深度反映状态样本被正确分类的数量。测试结果表明,所有故障类型中均有480个样本参与测试,其中第279类均被判断正确,分别对应轴承编号为KA03KI03KI16,其他类别的样本均有少量误判。准确度较低的主要原因是标签3和标签5误分类。这可能是由于这些故障信号之间的相似性,导致分类困难。

 

5  混淆矩阵

2示了MLKFE-LSTM10次重复运行中的平均准确度、精确度、召回率和F1分数。结果显示,MLKFE-LSTM实现了99.84%的平均精度。所有检测结果的F1分数超过99%其中6次的精度100%。整体故障诊断结果验证了所提MLKFE-LSTM框架能够有效检测各种滚动轴承故障。

类别标签

准确率(%)

召回率(%)

F1得分(%)

0

99.38%

99.79%

99.58%

1

99.79%

100%

99.90%

2

100%

100%

100%

3

100%

98.54%

99.27%

4

99.17%

100%

99.59%

5

100%

99.38%

99.69%

6

99.79%

99.79%

99.79%

7

100%

100%

100%

8

99.38%

100%

99.69%

9

100%

100%

100%

平均精度

99.75%

2  实验评分统计

4.4数据可视化与对比实验

 

6  数据可视对比

为了证明所提出的特征学习方法的有效性,采用了基于t-SNE[5]降维方法的数据可视化技术。该算法旨在以尊重点之间的相似性的方式将高维数据点嵌入到低维空间t-SNE技术被应用于个数据:原始电流数据通过所提方法提取的特征集。图6显示了个数据集的二维嵌入。原始数据的可视化未能现出10种类型标签的明显区别数据点几乎混淆在一起,难以区分。经网络处理后的特征可视化则清晰地分离了数据点表明所提网络提取的特征能有效帮助识别数据点的标签。

为了更深入地评估所提出的轴承故障诊断方法,将MLKFE_LSTM模型与其他在轴承故障诊断领域表现突出的机器学习分类模型进行比较。这些模型均为从作者发布的开源代码中重新实现,包括全卷积神经网络FCNs[6]残差网络ResNet[7]、长短期记忆网络(LSTM[8]不同训练数据量的情况下,对比模型的实验结果见表3,训练样本数量从1600个样本(每类160个)16000个。

诊断方法

训练样本数量

1600

3200

4800

6400

9600

16000

FCNs

54.65

61.34

67.77

78.23

93.62

95.79

ResNet

62.12

75.88

82.27

88.13

93.14

96.83

LSTM

75.17

81.87

86.93

92.28

93.64

98.82

MLKFE_LSTM

83.51

87.56

93.43

97.03

99.17

99.75

3  不同模型对比统计

从实验结果可以观察到,当训练数据量非常有限时,基于卷积网络的FCNs模型表现不佳,其准确率在仅有1600个样本的情况下仅为54.65%。这表明FCNs对数据量的依赖性较强,缺乏足够的训练样本会导致模型无法有效学习到故障特征。ResNet的表现稍好,但在同样的样本量条件下,其准确率仅为62.12%,仍未达到令人满意的水平。相比之下,LSTM作为一种能够处理序列数据的模型,在较低样本量的情况下表现出更强的鲁棒性,其准确率达到了75.17%。这说明LSTM能够更好地捕捉序列中的时间依赖特征,尽管数据量不够充足,但仍能识别出一定的故障模式。

值得注意的是,MLKFE-LSTM模型在各个样本量条件下均表现出色,尤其是在少量数据训练时,其准确率达到了83.51%。这一结果表明,提出的多尺度大核特征提取模块(MLKFE)有效增强了特征的表达能力,使模型能够在样本量不足的情况下仍然进行准确的故障识别。此外,随着训练样本数量的增加,MLKFE-LSTM模型的性能持续提升,最终在16000个样本中达到了99.75%的准确率,显示出其在处理大规模数据时的优越性。

综合来看,MLKFE-LSTM模型通过结合卷积网络和循环网络的优点,优化了特征提取与分类过程,提高了对滚动轴承故障的识别能力。与其他模型相比,其在数据量较少和较多情况下均展现了良好的性能,充分验证了该方法在实际应用中的有效性和可靠性。

5 结论

主要针对电流信号在滚动轴承故障诊断中的应用进行了研究,分析了传统方法在处理复杂信号时的局限性,提出了一种基于多尺度大核特征提取长短时记忆网络的故障诊断方法(MLKFE-LSTM)。该方法首先将输入的电流信号转换为频谱图,以丰富信息并增强特征提取的效果。在特征提取过程中,提出了一种多尺度大核特征提取模块(MLKFE),结合了深度卷积和扩张卷积,以高效捕获长时依赖特征和细粒度特征。其次,经过特征提取后,输出特征将被并行馈送到分类模块,具体包括全连接层和长短时记忆网络(LSTM),以进行故障类型的识别。通过这种设计,在提取局部特征的同时,充分考虑全局上下文信息,从而提高故障诊断的准确性和鲁棒性。在实验中,我们对不同类型的信号进行了处理,并通过分类模块实现故障类型的识别。实验结果表明,所提出的MLKFE-LSTM模型在PU数据集上的分类准确率高达99.75%,显现出在滚动轴承故障检测上的卓越性能。

 

参考文献:

[1] Enzo C. C. Lau; H. W. Ngan. Detection of motor bearing outer raceway defect by wavelet packet transformed motor current signature analysisJ. IEEE Transactions on Instrumentation and Measurement2010.

[2] Alex Krizhevsky, Ilya Sutskever, Geoffrey E. Hinton. Imagenet classification with deep convolutional neural networks[J]. Advances in Neural Information Processing Systems, 2012.

[3] M. H. Guo, C. Z. Lu, Z. N. Liu, M. M. Cheng, and S. M. Hu. Visual attention network[J]. Comp. Vis. Media, 2023.

[4] Lessmeier, Christian et al. Condition  monitoring  of  bearing  damage  in electromechanical drive systems by using motor current signals  of  electric  motors:  a  benchmark  data  set  for data-driven  classification[C].PHM  Society  European Conference,2016.

[5] Maaten, Laurens van der , Geoffrey E. Hinton. Visualizing data using t-SNE[J]. Journal of Machine Learning Research, 2008.

[6] Wang, Z., W. Yan, T. Oates. Time series classification from scratch with deep neural networks: A strong baseline[C]. 2017 International Joint Conference on Neural Networks, 2017.

[7] Shuai Jiang, Chuanqi Hua, Muye Yuan. Image classification method of bearing fault based on BOA optimization ResNet-18[C].2023 IEEE International Conference on Sensors, Electronics and Computer Engineering (ICSECE),2023.

[8] C. -J. Chang, C. -C. Chen and B. -H. Chen. Bearing Fault Diagnosis Based on an Advanced Method: ID-CNN-LSTM[C]. 2023 IEEE 6th Eurasian Conference on Educational Innovation (ECEI), 2023.

 

 

作者简介:

曾胜亮(1987-),男,湖南长沙,硕士研究生,华中科技大学,主要研究方向为轴承故障诊断。

通讯作者简介:

吴祉汐(1996-),男,河南周口,博士研究生,华中科技大学,主要研究方向是多电平功率变换器故障诊断。

 

 

 

 
 
[ 应用案例搜索 ]  [ ]  [ 告诉好友 ]  [ 打印本文 ]  [ 关闭窗口 ]  [ 返回顶部 ]

0条 [查看全部]  网友评论