气象雷达故障定位分析

(整期优先)网络出版时间:2021-04-28
/ 3


气象雷达故障定位分析

王晓迪

陕西长岭电子科技有限责任公司产品开发部,宝鸡, 721006

摘 要:本文主要介绍了某型号气象雷达开机后出现“雷达通电后不工作,无自检画面”的故障现象,出现故障现象后,操作人员对雷达多次进行通电、断电操作,雷达均不能正常工作,切换到自检模式,综显系统无自检画面显示。

关键词:故障定位 分析 雷达


1问题定位

雷达整机由收发机、阵列天线和天线驱动器构成。收发机由电源模块、接口处理模块、X波段集成收发模块和信号处理模块组成;阵列天线属于纯结构件,其损伤或损毁只会影响雷达的收发功能和性能指标,不会导致上述故障;X波段集成收发模块通过接口处理模块接收信号处理模块的指令,根据指令完成雷达的收发功能,会造成雷达在工作模式下的功能和性能异常,不会导致上述故障;天线驱动器通过接口处理模块从信号处理模块接收控制指令和发送反馈信息,会造成雷达方位和俯仰扫描功能故障,不会导致上述故障。因此气象成像雷达通电后不工作故障可能由接口处理模块故障、电源故障或信号处理模块故障引起。

故障检测和排查如下:

1)电源故障

电源故障会造成雷达供电不正常,引发雷达通电后不工作,无自检画面故障。雷达整机的供电通过外部输入的28V电源转换为雷达各分机和模块工作所需的电源电压。使用三用表对电源模块输出电压进行测量。测试结果表明各电源模块输出的电压满足要求,因此,雷达电源功能正常。

2)接口处理模块故障

雷达通过ARINC429总线接收综显系统指令,通过ARINC453总线向综显系统发送数据,接口处理模块ARINC429电平转换芯片工作不正常会导致雷达无法接收综显系统指令,从而无法根据指令做出响应,ARINC453电平转换芯片工作不正常会导致雷达数据无法发送到综显系统或将错误的数据发送给综显系统。

使用三用表对接口处理模块上的电源进行测量,测量结果正常,排除接口处理模块上电平转换芯片的问题。

由于雷达通电后不工作的故障可能由接口处理模块故障和其他模块联合作用引起,因此在本项测试完成后,继续使用该接口处理模块完成后续测试。

3)信号处理模块

信号处理模块主要完成ARINC429和ARINC453等接口数据处理、雷达中频回波信号处理和数据处理等功能,信号处理模块故障会导致雷达无法正常工作。更换一块信号处理模块备件,通电后雷达一切正常。断电后,将原雷达接口处理模块换回,通电后雷达一切正常,因此可以初步确定是信号处理模块存在故障。将故障信号处理模块重新装入整机,并连接调试板,通过SecureCRT 8.0监测信号处理模块调试串口的输出信息,可判断雷达启动过程中信号处理模块加载VxWorks系统镜像文件错误,启动过程被中止,由于雷达的数据处理软件需要在VxWorks系统环境下运行,因此系统启动中止会导致雷达不能正常工作,出现雷达通电后不工作,无自检画面故障。

根据以上检测和分析结果,可确定信号处理模块启动功能故障。

2 信号处理模块启动功能故障排查

2.1硬件和电路排查

硬件电路排查主要包括外观和焊接排查、电源功能排查和时钟功能排查。

1)对信号处理板进行目视外观检查,未发现损坏或变形;通过高倍放大镜目视检查印制板表面贴装元器件的焊点,未发现虚焊、脱焊等焊接异常;对印制板上的表贴芯片进行X光检测,未发现芯片有开裂等损伤现象。

通过PCB设计中预留了测试点对电源芯片输出的电压值进行测量,未发现异常。因此可以确定信号处理模块电源功能正常。

2)在信号处理模块中,所有数据、逻辑单元等的状态更新都是以时钟为基础的,时钟频率在其中起着同步的作用。如果时钟电路出现故障,或者时钟信号频率存在异常抖动、信号线串扰、电磁干扰等现象,造成时钟信号的质量不能满足使用要求,就可能会引起模块运行不稳定或者发生故障。由于信号处理模块启动故障实际上是FPGA芯片PS部分搭载的VxWorks系统启动故障,因此需要对PS部分的DDR3时钟和系统时钟进行检查。测试结果表明时钟正常,因此可确定信号处理模块时钟电路工作正常。

2.2数据分析

通过对故障信号处理模块硬件的排查,可排除硬件故障。由于信号处理模块启动功能故障输出的信息表明了数据校验未通过,为确定故障根源,需要对信号处理模块中存储的VxWorks系统镜像数据进行分析。将故障信号处理模块调试串口和网口连接到上位机,上位机通过SecureCRT软件监测调试串口输出信息和发送调试命令,并通过TFTP软件与信号处理模块进行数据通信。通过直流稳压电源向信号处理模块通电,进入Uboot后,上位机发送调试命令,读取NAND Flash中偏移地址为0x4000000,长度为0xA00000的VxWorks系统镜像数据,并通过TFTP网口发送到上位机。读取数据操作命令和Uboot下的反馈。

读取数据的操作已在工作正常的信号处理模块上进行了验证,读出的数据结果与原始的镜像文件完全一致,可确认该操作的可靠性。在上位机通过Matlab软件对读取的数据进行分析,与原始的VxWorks系统镜像文件数据进行比对后发现,在读取的数据中偏移地址为0x4C5F51处发生了数据错误。造成这种现象的原因有两个,一是读取数据过程外部干扰偶发异常,导致数据出错,二是由于NAND Flash中存储的VxWorks镜像数据发生了错误。由于信号处理模块启动过程读取VxWorks镜像数据和使用上位机读取VxWorks镜像数据时,对数据的读取操作是相同的,因此使用上位机对NAND Flash中的VxWorks镜像数据进行多次读取和分析,分析结果表明多次读取的数据都是在偏移地址为0x4C5F51处发生了数据错误,可排除读取过程偶发异常导致数据出错,因此可确定NAND Flash中的VxWorks系统镜像数据错误。

根据以上分析结果,建立雷达“通电后雷达不工作,无自检画面”故障树,如图1所示。

6088b91d9a471_html_2e2092219f28dc75.gif

图1 雷达故障树

根据雷达故障树,继续对软件以及NAND Flash芯片等进行故障排查。

2.3 软件故障排查

软件排查包括Uboot软件故障排查和用户软件故障排查。

2.3.1 Uboot软件故障排查

雷达启动时,需要通过Uboot对NAND Flash进行读取操作。Uboot软件故障排查主要是对Uboot启动源码进行排查。该源码是为官方源码,应用中未做任何修改。

经查询,官方未对源码发布过启动故障相关的公告或者修复补丁,可认为该源码是可靠的,排除软件源码造成信号处理模块启动功能故障。将编译生成的Uboot镜像文件装入SD卡,通过跳接电阻将信号处理模块启动方式设置为SD卡启动,将SD卡插入卡槽,通电后,信号处理模块可以正常启动,说明编译生成的Uboot镜像文件正常,排除Uboot编译环境造成信号处理模块启动功能故障。

2.3.2 数据处理软件故障排查

雷达的数据处理软件在VxWorks系统环境下运行,主要实现雷达从综显系统接收ARINC429控制指令,经过数据处理软件解析后,与经过处理的雷达回波数据打包形成ARINC453数据发送给综显系统,在此过程中数据处理软件运行中不会对NAND Flash进行任何操作。对数据处理软件源码排查,也未有对NAND Flash进行读写或擦除的操作语句。因此排除用户软件故障导致NAND Flash数据错误。

2.4 NAND Flash芯片故障排查

通过硬件和电路排查确定NAND Flash芯片无物理损伤,无虚焊或漏焊管脚,且供电满足设计要求。

将故障信号处理模块通电,对NAND Flash中的数据进行备份,通过上位机向其中重新写入Uboot镜像、bitstream镜像和VxWorks系统镜像等数据,断电,再次通电后,故障消失,信号处理模块可以正常启动,多次通断电,仍然正常启动。

因此确定NAND Flash芯片未发生故障。

2.5 软硬件兼容性故障排查

软硬件兼容性故障排查涉及到的软件为Uboot软件,硬件包括FPGA和NAND Flash,需要对三者之间的兼容性进行分析排查。由于Uboot软件和FPGA同为XiLinx公司产品,信号处理模块使用的Uboot软件的源码包是XiLinx官方面向Zynq-7000系列SoC开发的,可排除二者之间的兼容性故障。软硬件兼容性故障排查主要对Uboot与NAND Flash芯片的兼容性以及NAND Flash芯片和FPGA芯片的兼容性进行排查。

2.5.1 Uboot软件与NAND Flash芯片兼容性排查

根据获取到的厂商号和设备号组合判断使用的ECC类型的判断。

美光的厂商号为0x2c,MT29F8G08ABACA系列NAND Flash的设备号为0xd3,在Uboot源码中可以找到与之匹配的组合条件,因此可确定Uboot软件与NAND Flash芯片不存在兼容性故障。

2.5.2 NAND Flash芯片与FPGA芯片兼容性排查

通过查阅厂家关于芯片兼容性的相关资料,发现XiLinx公司在2018年6月13日发布了一条问题回复记录AR#47597,内容如图2所示。

6088b91d9a471_html_43fa854ac9b6f008.png

图2 AR#47597问题回复记录

该记录主要内容是美光的设备号为0xA3、0xB3、0xC3、0xD3的NAND Flash在启动模式(boot mode)下无法工作,但未说明故障现象。启动模式即信号处理模块的Uboot模式,参考Uboot启动源码,其中涉及到NAND Flash设备号的内容只有NAND配置中ECC相关内容,并且在不出现数据错误的情况下信号处理模块可以正常启动和使用,因此可以推断该记录的内容实际上表明以上设备号的美光NAND Flash在启动模式下ECC不工作。XiLinx在2020年5月1日发布AR#50991问题回复记录进一步证明了以上推断,该记录主要内容是回复关于Zynq-7000 SoC配置支持的设备的提问。其中提到NAND相关内容如图3所示。

6088b91d9a471_html_ee33f3256dcbdd84.png

图3 AR#50991中关于NAND的内容

AR#50991的内容表明,Zynq-7000只支持On-Die ECC和1-Bit ECC的NAND设备。查阅信号处理模块NAND Flash的芯片手册,其中对MT29F8G08ABACAWP-ITC型号的ECC描述如图4所示。

6088b91d9a471_html_a7a0420d86a9dc47.png

图23 MT29F8G08ABACAWP-ITC的ECC要求

根据图2内容,MT29F8G08ABACAWP-ITC芯片只支持8-bit的ECC,不符合AR#50991中On-Die ECC或1-Bit ECC的要求,在启动模式下ECC失效,此时如果NAND Flash中如果出现数据位翻转错误,就会导致信号处理模块启动功能故障。

通过以上对软硬件兼容性的分析排查,确定NAND Flash和FPGA芯片之间存在兼容性故障。

3故障定位

通过对信号处理模块外观、电源电路、时钟电路等硬件进行检测分析,未发现可能导致信号处理模块启动功能故障的异常情况。通过数据分析确定信号处理模块的NAND Flash芯片中存储的VxWorks系统镜像发生了数据错误。通过分析软件源码排除了软件代码和编译环境导致数据错误的可能性。对故障信号处理模块的NAND Flash刷入正常数据后,信号处理模块可以正常启动,证明NAND Flash芯无故障。最终,根据源码内容、官方发布的问题回复记录、NAND Flash芯片手册等内容,发现在2017年8月研制该信号处理模块时,该NAND Flash芯片的选型不符合目前官方对于Zynq-7000 SoC器件NAND Flash芯片的选型要求,因此可确定信号处理模块启动故障的根本原因在于NAND Flash和FPGA之间存在不兼容问题。该问题表现为,由于NAND Flash芯片的ECC要求和FPGA芯片的ECC功能不兼容,ECC功能失效。如果NAND Flash芯片中出现位翻转数据错误,信号处理模块则会发生启动功能故障,进而导致雷达发生“雷达通电后不工作,无自检画面”故障。该故障定位为NAND Flash与FPGA的兼容性故障。


[1] XiLinx官网