更新时间:05-31 (G战队)提供原创文章
摘要:利用人说话所发出的语音信号来实现的身份验证系统也是在说话人识别的范畴之内。它是一种生物认证技术并以人所发出的声音来识别人的,它是提取了说话人语音信号的特征来进行分析的,根据一些系统的算来建立说话人大集合从而确定说话人是否存在系统的大模型中,然后达到身份验证的效果。随着计算机科学技术的发展和互联网技术的日益成熟,通过语音验证身份的系统也越来越受到人们的关注,它在互联网安全与智能系统领域都有很好的应用前景。
有关文本的说话人识别本文研究的主要内容,为每一说话人建立一个能够描述该说话人个性特征的模型是它的基本原理,它的标准模板构建是以这一说话人个性特征为基础。在辨认说话人时,说话人辨认的结果取与测试音匹配距离最小的说话人模型所对应的说话人;在确认说话人时,用来进行比较的是所声称的说话人模型与测试音的模型,我们为匹配距离规定一个值,如果小于规定值说话人的身份就得以确定,如果大于规定值就否定说话人身份,基于本文我的主要工作如下:
(1)在前期的工作中,通过查阅相关的文献与资料对说话人识别原理与方法有一定了解后,语音身份验证系统的设计中选择简单容易实现的GMM(高斯混合模型)进行模型建立与模型匹配。
(2)然后,在模型的建立之前将采集到的语音信号由模拟信号变为数字信号,然后进行预加重与加窗分帧,用梅尔倒谱系数算法来提取语音信号的特征。
(3)其次,在说话人的系统设计中利用的说话人身份算法是GMM(高斯混合模型)。
(4)最后,利用MATLAB进行程序的编写与实现算法仿真,实现了基于语音的身份识别系统的设计,并较好的验证了本文算法的身份识别效果。
关键词:语音处理;梅尔倒谱系数;高斯混合模型
目录
摘要
Abstract
1 引言-1
1.1 课题研究的意义-1
1.2 研究的背景及现状-1
1.3 本文主要研究的内容-2
2 语音信号的特征分析与提取-3
2.1 语音信号的时域特征-3
2.1.1 语音信号加窗分析-3
2.1.2 语音信号的短时能量-5
2.1.3语音信号的短时平均过零率-6
2.2 语音信号的频域特征-8
2.2.1 短时傅立叶变换-8
2.2.2 语谱图-9
2.3语音信号特征参数提取-10
3基于高斯混合模型的身份识别-11
3.1 高斯混合模型的基本原理-11
3.2 说话人的特征训练过程-13
3.3 说话人特征识别过程-14
4 系统的实现与运行-15
4.1 MATLAB图形界面的编程-15
4.2 语音身份识别软件流程图-16
4.3 身份识别系统运行分析-17
总 结-19
参 考 文 献-20
致谢-21