多通道音频信号采集及分析系统研究

(整期优先)网络出版时间:2023-02-23
/ 2

多通道音频信号采集及分析系统研究

朱维

610324198401050613

摘要:随着社科技不断进步,多通道音频信号采集在生产生活中应用非常广泛,在声源定位、广播电视、鸣笛抓拍、语音增强、智能机器人、智能家居、车载通话设备等领域中都存在信号采集的广泛应用,其中声源定位技术是音频信号采集系统最直接的应用。

关键词:多通道音频;信号采集;分析系统

引言

在现代的信息技术行业,为了准确判断声音的采集是否正常,常用的设备就是通过麦克风等音频信号采集设备来收集信号。而在实际的采集过程中,其采集设备通常会受到人为无意识地破坏或其他不可以抗拒的原因导致声音的采集不准确,而监控声音的工作人员没有及时发现所采集的信号是否正常,进而丢失了相关的音频信息,也就没有办法去实时监控音频数据。而且检测该采集设备的连接是否正常时采取人工检测,效果不佳且费时费力,不适用于大系统。

1声源定位模型

1.1麦克风阵列拓扑结构

考虑到麦克风阵列的实际定位效果,本着简单有效的原则,基于麦克风阵列拓扑结构,推导出五元声源定位模型进行声源定位,五元麦克风阵列模型如图1所示。

1676957598935

图1五元麦克风阵列模型

其中,m0、m1、m2、m3、m4表示不同位置麦克风,相应的麦克风阵元坐标为m0(0,0,0)、m1(d,0,0)、m2(0,d,0)、m3(0,0,d)、m4(-d,0,0),d为各麦克风间距。S代表信号声源。α、β、γ表示信号声源与参考阵元m0所在直线分别与x轴、y轴、z轴正方向的夹角。

1.2定位模型的推导

根据空间解析几何列出方程组如下:

1676957630321

t表示信号声源到达m0传播时间,t1、t2、t3表示声源到达麦克风m1、m2、m3与m0之间的时延,t4表示声源到达麦克风m4与m2之间的时延。

由远场模型下到达时延的计算模型知,α、β、γ的计算公式如下:

   1676957664086

由于在空间直角坐标系求解比较复杂,这里引入球坐标系进行转换运算,球坐标系坐标可表示为:(r,θ,φ)。γ为声源与参考阵元m0所在直线与z轴正方向的夹角,也即俯仰角,对应球坐标系中的φ,也即φ=γ。α、β分别为声源与参考阵元m0所在直线分别与x轴、y轴正方向的夹角,在球坐标系中,θ为方位角,因此,tanθ=cosβ/cosα。

1.3互相关时延估计算法

首先进行 FFT 运算,将信号从时域变换到频域,抑制噪声部分的频谱,再通过 IFFT 将信号从频域反变换到时域,锐化互相关函数在时延处的峰值,提高时延估计的性能。利用 FFT 运算以及 IFFT 运算的结果,进行互相关时延估计算法。

2系统硬件设计

多通道音频信号采集及分析系统的硬件组成主要包括多核异构处理器AM5708、电源及电池管理模块、音频采集与处理电路、模数转换电路、通信电路、网络接口电路、液晶屏显示接口电路、北斗定位接口电路。多核异构处理器AM5708作为系统核心板,其主要工作是实现音频信号采集及信号分析,进而实现数字音频信号处理算法。电源由DC/DC降压转换电路组成,为设备提供不同等级的电压。音频信号采集电路则实现多通道音频信号的采集。A/D转换芯片实现信号的模数转换,将采集到的模拟信号转换为数字信号。通信电路则是保证系统正常通讯。网络接口则是为了传输数据以及程序更新。液晶屏主要显示系统通道音频强度、当前增益、定位指标等相关信息。

2.1异构微处理器核心板选型

采用某公司的SOM-TL5708核心板作为系统处理器,该核心板是一款集成DSP与ARM的双核微处理器,性能优越,有着DSP与ARM的全部优点。核心处理器集成ARMCortex-A15、C66x浮点DSP等处理单元,支持IPC多核开发。该核心处理器外设资源丰富,集成千兆网、USB2.0、UART、SPI、I2C等工业控制总线,完全满足系统所有控制要求。由于声源定位系统对信号采集与处理的速度要求非常高,该核心板的双核处理器可以将任务有效分配,同时该核心板可降低开发难度,因此选定其作为系统声源定位的实现。

2.2多通道音频信号同步采样电路设计

音频信号采集电路是系统硬件设计的关键,它的成功与否直接决定着信号采集的准确性与实时性,因此在硬件电路设计中音频信号需要经过放大、滤波后才能够输出到下一级电路中。系统信号采样通道的基本功能是采样通道的信号隔直、增益调整,并经过8阶椭圆滤波芯片MAX294进行滤波。电路中还包括不同增益校准、滤波器旁路等功能。增益调整、信号校准和滤波器旁路功能均通过低漏电流、低导通电阻的电子开关芯片完成,核心板通过I/O电平的状态控制电子开关动作。

通道音频信号采集与处理电路由5路传声器、信号放大器、滤波器、电压跟随器、模数转换器等组成,负责音频信号的采集与处理。信号放大芯片为AD620BR,芯片功耗较低,芯片通过1号引脚和8号引脚之间连接的电阻RG进行增益设置,RG阻值不同增益也不同,可设置的增益范围为1-10000。

信号调理电路中的滤波器芯片为MAX294,MAX294为8阶椭圆滤波器。芯片时钟引脚设置与内部晶振频率有关,MAX294的截止频率是10kHz,晶振频率为1MHz,晶振频率是截止频率的100倍,因此改变开关电容的值可以对滤波器芯片的滤波截止频率进行设置。

2.3通信电路设计

RS232通信接口电路为RS232转UART3,调试串口是将UART3通过SP3232EEY串口电平转换芯片转换为RS232串口,其使用9针DB9接口,DB9与PC机连接稳固,系统后台信息不会丢失,保证了硬件系统的稳定性。基于该RS232通信接口,借助串口调试终端,对嵌入式系统DSP端进行相关指令操作。

RS485接口。扩展了两路485接口,方便后续应用场景中使用。两路RS485通信接口电路分别为RS485转UART1、RS485转UART2。

SPI存储模块。FRAM存储器作为系统的存储功能模块,主要用于保存系统参数,系统参数主要为外接的5个传声器灵敏度等参数。使用的RAM芯片为FM25L16B,FM25L16B存储器内存特点为16kB、串行3VFRAM,是非易失性存储器,读写性能与RAM类似,采用高速SPI总线,增强了FRAM高速写入能力。

2.4电源模块设计

系统由锂电池供电或者由电池充电器供电,电源及电池管理模块实现电池充/放电电压、充/放电电流的检测与控制。系统总供电电源为12V直流电,控制板各模块电路所需电压为5V或3.3V直流电,因此需要将12V直流电转为5V和3.3V直流电。同时系统为模拟信号采样,需要±5V电压给信号采集处理电路供电,因此设计转换电路产生±5V电压。

3检测音频信号采集设备装置的应用

为了准确获得该设备连接的检测结果,还涉及相应的检测装置。该装置主要包括了:音频信号获得模块、N帧时域音频数据提取模块、第一计算单元、第一判断单元、第一判定单元等。

音频信号获得模块:首先是需要获得能够检测的音频信号数据信息。N帧时域音频数据提取模块:其次是通过技术提取出相应的N帧时域音频数据。第一计算单元:用于计算所述N帧时域音频数据的能量值E。第一判断单元:用于判断所述能量值E与预设的能量值阈值Eth的大小关系。第一判定单元:当所计算的音频信号能量数E≥提前预设的能量阈值Eth时,所采集到的音频信号转换成N帧频域音频数据,再判断其的谱峰频率是否具备稳定状态。该检测应用装置还有报警单元和第二判定单元。第二判定单元:当所计算的音频信号能量值E﹤提前预设的能量阈值Eth时,就可以判定其设备异常连接。报警单元:就是当判定了采集音频信号的采集设备之间的连接存在异常现象,生成报警信号进行报警。

结语

多通道音频信号的采样频率可以提高到 100kHz 以上,进一步提高定位精度与定位性能;由于计算量较大,提出的嵌入式系统方案,不能实现采集、分析同步进行。后期可以通过 ARM、DSP 任务分工优化,以及简化核心算法等方法,在保证精度前提下进一步提高实时性。

参考文献

[1] 毕春艳,陈莹莹.人工智能环境下音频信号完整度检测系统设计[J].现代电子技术,2020,43(08):169-172.

[2] 梁方舟,李金泉,黄训磊,等.基于STM32的音频信号分析设计与实现[J].现代电子技术,2014,37(1):19-21.

[3]江涛,侯伟 .嵌入式音频信号分析仪的设计与实现[J].电子测量技术,2019,42(13):137-141.