嵌入式系统/ARM技术中的基于SoPC的实时说话人识别控制器
文件大小: 280k
源码售价: 10 个金币 积分规则     积分充值
资源说明:摘  要: 运用软硬件协同设计,在DE2-70开发板上实现了一个基于SoPC的实时说话人识别控制器,控制器有很好的实时性和良好的识别性能。控制器的语音特征参数采用线性预测倒谱系数(LPCC),匹配算法采用动态时间规整算法(DTW)。   1 算法简介   说话人识别系统主要实现建模及识别两方面功能。建模功能提取语音的特征参数并存储起来形成用户模板。识别功能提取语音的特征参数,与模板参数进行匹配,计算其距离。系统框图如图1所示。本文采用改进的DTW(Dynamic Time Warping)算法和LPCC(Linear prediction cepstrum coefficients)特征参 在嵌入式系统和ARM技术领域,基于SoPC(System on a Programmable Chip,可编程片上系统)的实时说话人识别控制器是一个重要的应用。它利用软硬件协同设计的优势,能够在DE2-70开发板上实现高效且实时的说话人识别功能。控制器的核心是通过线性预测倒谱系数(LPCC)提取语音特征,并运用动态时间规整(DTW)算法进行匹配。 线性预测倒谱系数(LPCC)是一种常见的语音特征提取方法,它利用线性预测分析来获取语音信号的倒谱参数。这种方法首先对语音信号进行分帧处理,然后通过有效音检测来确定有声和无声部分。加窗操作随后进行,以减少处理过程中可能出现的误差。LPCC算法通过计算每帧语音的线性预测系数,进一步转化成倒谱系数,这些系数能有效地反映语音的频谱特性。 动态时间规整(DTW)算法是语音识别中的经典匹配算法,尤其适用于不同长度的语音序列比对。在传统DTW中,匹配过程受测试语音参数长度的限制,而改进后的DTW引入了全局约束,使得在未知测试参数长度的情况下也能进行有效的全局匹配。同时,局部约束策略用于优化搜索路径,确保算法的实时性和准确性。 Matlab仿真结果显示,该系统在说话人个性信息和语意信息的识别上表现优秀。实验1表明,系统对不同人的发音有高精度的识别能力,等错误率(EER)仅为0.01。实验2进一步验证了系统在识别语意上的准确性,同样保持了低EER。实验3的综合测试则证明,在兼顾说话人个性和语意的情况下,系统仍然能够达到高识别率。 SoPC系统构建包括选择NiosII/f核心CPU,并启用硬件乘法器、定制复位和异常向量地址。定时器的设置至关重要,一个用于语音样点的采集,另一个用于时间标签的插入。系统还包括各种外设,如内存、闪存、输入输出设备以及音频模块等,以支持完整的语音处理和用户交互。 软件流程方面,系统首先初始化,然后持续采集语音数据,提取LPCC特征,接着进行DTW匹配,根据匹配结果做出决策,并通过用户界面反馈识别结果。整个流程体现了软硬件协同设计的高效性和实时性,确保了说话人识别控制器在嵌入式环境中的稳定运行。
本源码包内暂不包含可直接显示的源代码文件,请下载源码包。