故障链表在故障原因分析上的应用

(整期优先)网络出版时间:2023-06-16
/ 2

故障链表在故障原因分析上的应用

苏巧,张宇翔

陆军装备部驻西安地区军事代表局  陕西西安  710000

【摘要】本文介绍了由故障模式影响分析(FMEA)引出的故障链表的方法,用以区分产品故障模式、原因和影响,有助于准确地排查产品发生的故障,采取必要的纠正措施改进产品质量,同时可以积累产品使用过程中的工程经验,为新产品设计提供数据支持。

【关键词】故障模式影响分析 故障链表 质量 工程

1引言

近年来,随着交付使用的装备数量不断增加,由使用方反馈的产品故障信息也随之大量增加,笔者几个新产品在交付后的技术服务过程中收集的故障信息,发现这些现场故障信息记录普遍存在原因分析不到位、记录不准确、缺少纠正措施等问题,导致较多故障重复发生。通过进一步了解,发现现场技术服务人员经常混淆故障模式和故障原因,有时甚至是故障影响。他们可能会从一个故障模式开始,并将其误认为是故障原因。例如某配电系统带灯保险丝盒熔断会引起散射通信数据中断,从而导致系统通信失败,但忽略了保险丝盒熔断本身还有其它潜在的故障原因。这样收集的故障信息往往是不完整的,甚至会产生误导。这种现象在产品试制和生产过程中也会发生,例如,现场调试人员记录的故障信息不完整、不充分或不准确,难以为产品改进提供有效的数据支撑。

为了解决上述问题,确保产品故障信息的完整性、准确性和有效性,本文提供了故障链表的方法,用以区分故障原因、模式和影响,并阐明它们之间的关系。

2故障链表的基本概念

故障链表来源于故障模式影响分析,是对产品实物实施故障报告分析与纠正措施系统(FRACAS)的实用工具。GJB/Z 1391-2016《故障模式影响及危害性分析指南》给出了用于不同类型的故障模式影响分析的程序,同时提供了一些工具可以支持其中的步骤,例如,可以使用边界图或系统树来分析产品的构成,也可以使用参数图或功能树来评估系统的功能。在产品研发阶段完成一次设计故障模式影响分析(DFMEA)的流程如表1所示。

表1    完成一次DFMEA的流程

阶段

系统分析

故障分析与风险消减

沟通风险

步骤

策划和准备

结构分析

功能分析

故障分析

风险分析

优化

文件化结果

主要措施

形成项目团队并识别范围

识别系统组成、单元及其相互关系

识别功能

识别故障模式、原因和影响

识别预防和纠正措施,以及严重度、频次和检测度

优化和改进

与相关方沟通风险

主要工具

支持性文件

边界图或系统树

参数图或功能树

DFMEA表

DFMEA表

DFMEA表

基于DFMEA表的报告

该标准对故障原因、故障模式和故障影响之间的区别提供了明确的指导。在故障链理论模型中,两者是一致的,即故障原因是为什么导致了故障模式,故障影响是会发生什么。然而,在实际的FRACAS运行过程中,几乎没有指导方法来区分故障的原因、模式和影响,也没有可用的工具。例如,石川图/鱼骨图通常用于识别故障原因,但如果所识别的故障原因实际上是一种故障模式,它将不会有帮助。

虽然差异应该很明显,但一些技术工程师经常混淆故障模式和原因,有时甚至是故障影响,因为故障原因、模式和影响在不同产品层次上是可以转化的,他们不认为故障影响会导致高层次的故障模式,也会是导致更高层次的故障原因,相反,工程师可能会从一个故障模式开始,并将其误认为原因。例如,壳体裂纹可能会导致漏水,从而导致系统故障,但裂纹本身还有一个潜在的原因。当技术工程师不清楚某件事是故障模式还是原因时,DFMEA设计师系统应提供指导,例如引言中提到的系统“通信失败”故障所建立的故障链表(如表2)可以提供帮助。故障链中的每个步骤都列在表格中,以便所有参与者都能清楚地看到故障链。

表2  故障链表示例

故障原因

故障模式1

故障模式2

故障影响

(最终)故障影响

配电系统输入电流过大

配电系统自身短路

保险丝盒故障

配电系统保险丝盒熔断

配电系统给散射通信分系统的供电无输出

散射通信分系统输出数据中断

系统通信失败

针对上述系统故障,如果将“配电系统保险丝盒熔断”列为故障原因是不正确的,如表3所示。因为“配电系统保险丝盒熔断”还有其它潜在的故障原因,所以这些潜在的原因丢失了,处理结果可能仅仅是更换故障保险丝盒,但无法采取纠正措施,同时也失去了改进的机会,导致该故障在一年多时间内多次重复发生。通过清晰地描述故障链可以使设计师系统更容易意识到实际的原因是缺失的,最终的结果是不正确的。表格中的内容必须移到右边,留下“故障原因”字段,工程师团队可以找出导致“配电系统保险丝盒熔断”的潜在原因。

表3    不正确原因的示例

故障原因

故障模式

故障影响

(最终)故障影响

配电系统保险丝盒熔断

配电系统给散射通信分系统的供电无输出

散射通信数据中断

系统通信失败

3故障链表的应用

当产品发生故障时,现场技术工程师除了确定故障现象、排查故障、修复产品以外,准确地记录故障处理过程的信息是必不可少的,特别是准确地定位故障原因将决定产品是否需要采取纠正措施,包括设计改进、工艺改进、增加备件、预防性维修等。基于FMEA技术的故障链表可以帮助项目团队分析产品故障的根本原因,例如,上述系统“通信失败”故障实际原因是保险丝盒的设计问题,其中指示灯和保险管电路存在短路故障隐患,后续由保险丝盒生产厂家采取了设计改进措施,彻底消除了故障隐患。

故障链表一般不能单独使用,项目团队可以使用石川图来分析故障原因,也可以借助其他工具来创建表格。在建立故障链过程中,应参考产品研发阶段DFMEA的结果,详尽描述故障原因、故障模式、故障影响和最终(对使用方)影响。针对一些难以由技术工程师确定的复杂故障,还需要设计师系统或外部供方的指导和帮助,因此建议定期召开故障审查会,确保故障分析过程的准确性,识别和确定改进产品的机会。

4需要关注的问题

首先,故障链表作为FRACAS的实用工具,类似简化的故障树分析(FTA),适用于产品试制、生产和使用阶段,对于设计阶段未开展FMEA的产品尤其有效。可以帮助生产、质量和技术服务人员分析故障原因,采取有效的措施,同时完整、准确地记录故障信息。

其次,对于复杂系统而言,故障链可能有多个层级的故障模式,即针对不同约定层次具有特定的故障模式、故障原因和故障影响,故障链表应能记录每个相关功能层次的故障模式,直至分析到故障的根本原因。表4列举了某复杂电子产品的故障链表的示例。

表4  某复杂电子产品故障链示例

故障原因

故障模式1

故障模式2

故障影响

(最终)故障影响

和射频信号无输出

1本振信号无输出

2本振信号无输出

收发脉冲开关故障

+5V电源供电无输出

变频组件和中频信号无输出

AD板和中频信号无输出

信号处理分系统测高数据错误

系统成像功能失效

最后,故障链表中的故障原因、不同约定层次故障模式以及影响的表述应采用已定义的标准故障模式,避免出现同一故障模式因记录人员或时间因素的影响而采用了不同的表述,或对于不同故障模式采用了相同的表述,从而发生混淆或误导的情况。

5结束语

应用故障链表的方法是基于FMEA、FRACAS、FTA等可靠性专业技术的实用工具,有助于项目团队正确区分故障原因、模式和影响,为排查故障、修复产品和改进提供依据。同时,正确地分析、处理和记录产品故障信息,能够为新产品开展通用质量特性设计工作项目积累工程经验。反之,遗漏或者不正确的故障信息不仅会造成工程经验的流失,而且可能造成产品故障或质量问题重复发生。