嵌入式系统/ARM技术中的基于SoPC的实时说话人识别控制器 - 源码 - 源码 - 免费下载

嵌入式系统/ARM技术中的基于SoPC的实时说话人识别控制器

文件大小： 280k

源码售价： 10 个金币积分规则积分充值

资源说明：摘要：运用软硬件协同设计，在DE2-70开发板上实现了一个基于SoPC的实时说话人识别控制器，控制器有很好的实时性和良好的识别性能。控制器的语音特征参数采用线性预测倒谱系数（LPCC），匹配算法采用动态时间规整算法（DTW）。　　1 算法简介　　说话人识别系统主要实现建模及识别两方面功能。建模功能提取语音的特征参数并存储起来形成用户模板。识别功能提取语音的特征参数，与模板参数进行匹配，计算其距离。系统框图如图1所示。本文采用改进的DTW(Dynamic Time Warping)算法和LPCC(Linear prediction cepstrum coefficients)特征参在嵌入式系统和ARM技术领域，基于SoPC（System on a Programmable Chip，可编程片上系统）的实时说话人识别控制器是一个重要的应用。它利用软硬件协同设计的优势，能够在DE2-70开发板上实现高效且实时的说话人识别功能。控制器的核心是通过线性预测倒谱系数（LPCC）提取语音特征，并运用动态时间规整（DTW）算法进行匹配。线性预测倒谱系数（LPCC）是一种常见的语音特征提取方法，它利用线性预测分析来获取语音信号的倒谱参数。这种方法首先对语音信号进行分帧处理，然后通过有效音检测来确定有声和无声部分。加窗操作随后进行，以减少处理过程中可能出现的误差。LPCC算法通过计算每帧语音的线性预测系数，进一步转化成倒谱系数，这些系数能有效地反映语音的频谱特性。动态时间规整（DTW）算法是语音识别中的经典匹配算法，尤其适用于不同长度的语音序列比对。在传统DTW中，匹配过程受测试语音参数长度的限制，而改进后的DTW引入了全局约束，使得在未知测试参数长度的情况下也能进行有效的全局匹配。同时，局部约束策略用于优化搜索路径，确保算法的实时性和准确性。 Matlab仿真结果显示，该系统在说话人个性信息和语意信息的识别上表现优秀。实验1表明，系统对不同人的发音有高精度的识别能力，等错误率（EER）仅为0.01。实验2进一步验证了系统在识别语意上的准确性，同样保持了低EER。实验3的综合测试则证明，在兼顾说话人个性和语意的情况下，系统仍然能够达到高识别率。 SoPC系统构建包括选择NiosII/f核心CPU，并启用硬件乘法器、定制复位和异常向量地址。定时器的设置至关重要，一个用于语音样点的采集，另一个用于时间标签的插入。系统还包括各种外设，如内存、闪存、输入输出设备以及音频模块等，以支持完整的语音处理和用户交互。软件流程方面，系统首先初始化，然后持续采集语音数据，提取LPCC特征，接着进行DTW匹配，根据匹配结果做出决策，并通过用户界面反馈识别结果。整个流程体现了软硬件协同设计的高效性和实时性，确保了说话人识别控制器在嵌入式环境中的稳定运行。

部分文件列表（点击文件名可查看文件内容）

					
									本源码包内暂不包含可直接显示的源代码文件，请下载源码包。