2026-03-09 01:50:49 网络安全文章来源：ZONE.CI 全球网 0 阅读模式

文章总结： 本文提出一种分布无关的概率小样本学习框架，解决工业预测性维护中数据稀缺与多故障模式识别难题。该框架结合原型网络与贝叶斯元学习，实现故障诊断与寿命预测的联合建模及不确定性量化。实验证明该方法在极少样本下显著提升了准确率与稳定性，为工业设备健康管理提供了有效解决方案。 综合评分： 88 文章分类： 安全建设,解决方案

cover_image

每周文章分享-250

网络与安全实验室

2026年3月8日 05:00 江苏

每周文章分享

2026.03.02至2026.03.08

标题:Distribution-Agnostic Probabilistic Few-Shot Learning for Multimodal Recognition and Prediction

期刊:IEEE TRANSACTIONS ON AUTOMATION SCIENCE AND ENGINEERING, VOL. 22, 2025.

作者:Di Wang, Xiaochen Xian, Haidong Li, and Dong Wang.

分享人:河海大学——周志凡

01 研究背景

随着工业智能化转型的深入，基于传感器数据与人工智能的设备预测性维护已成为保障安全、提升效益的关键。这使得机器学习技术在该领域广泛应用，以学习和预测设备的健康状态与剩余寿命。然而，在实际工业场景中，高质量、带标签的故障数据往往因成本高昂、发生概率低而极其稀缺，构成了“小样本”的核心挑战。尤其在设备存在多种潜在故障模式的复杂情况下，不同故障会引发迥异的退化轨迹，而现有大多数方法或将故障诊断与寿命预测割裂处理，或难以在数据稀缺时协同处理这两个任务并量化预测不确定性，导致在真实、复杂的工业环境中应用效果受限。为此，本文提出了一种与分布无关的概率小样本学习统一框架，旨在通过联合建模与元学习，让模型仅凭极少样本就能同时可靠地识别故障模式并预测剩余寿命，同时提供预测的不确定性度量。

02 关键技术

本文所提出的与分布无关的概率小样本学习统一框架的核心是一个集成了原型网络与贝叶斯元学习的多任务神经网络：首先，从传感器信号中提取的退化速率特征作为输入；接着，原型网络为每种故障模式在嵌入空间中构建原型，通过计算距离实现小样本下的精准分类；同时，多模态贝叶斯模型无关元学习（MBMAML）为每种故障模式构建一个回归子网络，并以概率分布形式建模其参数，从而量化预测不确定性；最后，通过一个概率混合模型，将分类网络输出的故障概率作为权重，对各回归子网络的预测分布进行加权融合，实现故障识别与寿命预测的联合学习与相互增强。

该方法的创新与贡献如下：

1）本文提出了一个全新的概率小样本学习框架，首次将多故障模式识别与剩余寿命预测这两个任务在数据稀缺条件下进行统一、协同建模。

2）框架创造性地结合了原型网络与贝叶斯元学习：利用原型网络解决小样本分类问题，并利用MBMAML处理小样本回归及其不确定性，最后通过概率融合机制将二者有机结合。

3）所提出工作的新颖性在于不假设参数的具体分布形式，而是通过分布无关的推理方法来灵活建模不确定性，从而在极少样本下实现了更稳健的故障诊断与概率性寿命预测。

03 算法介绍

（1）故障模式识别模块

图 1 故障模式识别模块

如图1所示，该模块的核心是构建一个原型网络，以解决小样本条件下的多分类问题。其设计思想是避免让模型直接学习从复杂特征到离散标签的艰难映射，而是通过比较样本在特征空间中的相对位置来做出判断。

在训练阶段，算法首先通过一个嵌入函数（通常为深度神经网络）将所有输入的特征数据映射到一个低维的表征空间。在此空间中，算法为每一个已知的故障模式类别计算一个具有代表性的点，称为“原型”。具体而言，每个类别的原型被定义为该类别下所有支持集样本在表征空间中对应点的均值向量，由以下公式精确定义。原型可以理解为某类故障在表征空间中的“质心”或“典型代表”。

在推理阶段，对于一个属于查询集的新样本，算法首先通过同样的嵌入函数将其映射到上述表征空间，得到其表征向量。随后，算法计算该向量与每一个故障类别原型之间的距离。文中采用负的平方欧氏距离作为相似性度量。距离越近，表示该样本与该类故障越相似。

最后，算法通过一个Softmax函数将这些距离转化为一个概率分布。该分布直观地表达了模型对于新样本属于各个故障模式的置信度，例如输出[P(模式A)=0.85， P(模式B)=0.15]。这种方法的核心优势在于，分类决策依赖于样本与各类别“中心”的相对距离，而非绝对的决策边界，这在小样本场景下能有效缓解过拟合，提升模型的泛化能力。

（2）剩余寿命预测模块

图 2 剩余寿命预测模块

如图2所示，该模块的核心是多模态贝叶斯模型无关元学习（MBMAML），设计动机源于一个关键观察：不同故障模式会导致设备产生截然不同的退化轨迹。因此，一个统一的回归模型难以做出精准预测，必须考虑故障模式的影响。

A. 多子网络结构

为了捕捉不同故障模式下的退化特性，算法为K种可能的故障模式构建了K个并行的回归子网络，如以下公式所示。每个子网络都是一个独立的神经网络，专门学习从输入特征到RUL值的映射关系，但其参数与结构均针对其对应的特定故障模式进行优化。

B. 贝叶斯元学习量化不确定性

这是本算法的核心创新。传统的回归模型在数据稀缺时容易过拟合，且只能给出一个确定的预测值，无法评估预测的可靠性。为解决此问题，算法对每个回归子网络的参数进行概率化建模，即认为网络参数服从一个分布而非固定值。通过引入贝叶斯框架，算法在训练过程中执行两个层次的更新：

1.针对每一个历史训练任务，算法利用其支持集数据，从所有任务共享的元参数出发，通过贝叶斯推断，更新得到一组仅适用于该任务的后验参数分布。这相当于为每台历史设备“个性化”调整了预测模型。

2.在获得所有任务的后验参数后，算法利用各任务的查询集数据，评估这些参数的性能，并以此反馈来更新和优化所有任务共享的元参数。目标是使得元参数能够作为一组良好的初始化，在面对新任务时，仅需少量样本就能通过快速调整获得准确的预测。

C. 概率融合决策

在最终对新设备进行RUL预测时，算法并非简单地选择一个最可能的故障模式对应的子网络。相反，它执行一次概率融合：将故障识别模块输出的故障概率分布，作为加权系数，对所有K个子网络生成的RUL预测分布进行加权求和。这意味着，最终的预测结果是一个考虑了所有可能故障模式及其发生概率的、混合的概率分布。该分布既给出了RUL的期望值，也通过其方差或置信区间明确量化了预测的不确定性。

该算法的有效性可以从学习理论的视角得到阐释。图3直观对比了传统机器学习方法与本文方法在处理小样本问题时的本质差异。传统方法在假设空间庞大而数据有限时，其经验风险最小化点可能因为假设空间过大且搜索无引导而严重偏离真实的最优假设。而本文方法通过原型网络结构有效约束了假设空间的复杂度，同时通过MBMAML的元学习机制引导了更高效的参数搜索方向，从而使模型能够在数据稀缺的条件下，收敛至更接近真实最优解的解决方案，从根本上提升了小样本学习的稳定性和泛化能力。

图 3 小样本学习效果的原理对比

04 实验结果分析

为模拟工业中数据稀缺的现实，研究构建了“N-task Q-shot”学习场景。其中，N代表用于训练的历史发动机（任务）数量，Q代表每台发动机可用的训练样本数。通过组合不同的N（20, 40, 80）和Q（1, 2, 5），设置了从极度稀缺到相对充足的九种不同数据条件的对比实验，以全面评估模型性能。

A. 不同寿命阶段的故障识别准确率

图 4 故障模式识别准确率对比

图4将测试发动机按其真实剩余寿命（RUL）长短分组，并对比各组内不同方法的故障识别准确率。图表会显示，当发动机临近失效，即RUL很小时，所有方法因观测数据充分而表现较好。但随着RUL增大，即观测数据变少、预测变难，传统方法的准确率急剧下降，而本文方法凭借其原型比对与小样本学习能力，在所有RUL阶段都保持了最高且最稳定的准确率。这证明了该方法适用于设备从早期到末期的全生命周期健康管理。

B. RUL预测误差分布对比

图 5 剩余寿命预测误差对比

图5同样按真实RUL分组，但展示的是各方法的RUL预测误差及其波动。图表中，本文方法不仅在绝大多数RUL组别中具有最低的平均预测误差（点位置最低），其误差棒（波动范围）也通常最短。这双重优势表明，本文方法不仅预测更精确，而且结果更稳定、不确定性更小。反观其他方法，尤其是传统机器学习方法，则表现出预测误差大且结果不稳定的特点。

C. 不同方法在故障识别任务上的错误分布

图 6 不同方法用于故障模式识别的混淆矩阵

图6直接精细地展示了在最具挑战性的“20-task 1-shot”数据场景下，不同方法在故障模式识别任务上犯错的具体类型与数量，本文方法的混淆矩阵最接近理想的对角矩阵。其对角线上的数字（正确分类数）显著高于所有基准方法，而非对角线上的数字（各类误判数）普遍为0或接近0，这直观地证明了其整体分类错误率最低。

观察传统方法（如KNN+NN， SVM+NN）的矩阵，会发现HPC与FAN两类故障之间存在明显的相互误判，图中表现为两个非对角格子都有不小的数值。这表明这些模型未能有效学习到区分这两种故障的本质特征，在特征空间中的决策边界是模糊的。

即使在数据如此稀缺的条件下，本文方法的混淆矩阵依然干净清晰。这说明其借助原型网络构建的“基于距离”的分类逻辑非常稳定。模型不是在学习一个复杂且容易过拟合的边界，而是通过将新样本与各类故障的“标准原型”进行比对来做决策，因此面对少数异常或噪声样本时，抗干扰能力更强。

D. 特征空间可视化

图 7 特征空间可视化对比

对比左右两图，最显著的差异是数据点的聚类与分离状态。在原始特征空间中，代表两种不同故障的红色点和蓝色点大量混杂、重叠在一起，没有形成清晰的边界。这直观地解释了为什么传统分类模型在此任务上表现不佳，因为它们所依赖的输入特征本身区分度很低，模型难以学习到一个稳健的决策边界。

在经过原型网络学习后的特征空间中，情况发生了根本性转变。红色点和蓝色点形成了两个内部紧密、彼此分离的簇。这意味着，原型网络通过其度量学习的目标，成功地将原始数据映射到了一个全新的特征空间。在这个空间中，同类故障的样本彼此高度相似，而异类故障的样本则差异显著。从特征学习的角度，直接证明了原型网络设计目标的达成，即学习一个能让同类样本聚集、异类样本分离的特征映射，这是其高分类精度的根本原因。

05 总结

本文解决了工业预测性维护中，在传感器数据极其稀缺且存在多种故障模式的情况下，进行精准故障识别与剩余寿命预测的难题。本文提出了一个分布无关的概率小样本学习统一框架，该框架通过原型网络实现对不同故障模式的鲁棒识别，并利用多模态贝叶斯元学习对每种故障模式下的剩余寿命进行概率化预测及不确定性量化。该框架的关键创新在于通过一个概率融合模型，将识别结果与预测分布深度耦合，实现了两个任务的协同优化与联合决策。

END

==河海大学网络与安全实验室==

微信搜索：Hohai_Network

联系QQ：1084561742

感谢关注！

免责声明：

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景，旨在提升网络安全防护能力，具有明确的技术研究属性。

任何单位或个人未经授权，将本文内容用于攻击、破坏等非法用途的，由此引发的全部法律责任、民事赔偿及连带责任，均由行为人独立承担，本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布，若存在版权侵权或其他异议，请通过邮件联系处理，具体联系方式可点击页面上方的联系我。

本文转载自：网络与安全实验室《每周文章分享-250》