1. 研究目的与意义
互联网时代,科技给人类带来的人类和计算机的交往越发受到研究重视。
而情感语音识别是人机交流的重要组成部分,人的语音不仅仅包含内容信息,还包含情感信息,情感语音识别是当前人工智能的重点研究方向,人的情感识别具有非常重要的现实意义。
近年来深度学习依靠强大的特征提取能力以及海量数据进行深层次建模能力在语音情感识别领域大有进步,其中深度信念网络(deep belief networks, dbn)是一个概率生成模型,由多个限制玻尔兹曼机(restricted boltzmann machines,rbm)层组成,通过训练每一次rbm网络确保尽可能地保留特征信息,再将特征向量映射微调至最优,它所表现出的强大无监督特征学习能力在语音识别方面提供了更高的识别率,从所阅读的相关dbn文献可知,在适宜分类器下dbn的训练时间泛化能力均优于其他模型,这也是我此次将dbn作为语音情感识别模型主要技术的原因。
2. 课题关键问题和重难点
1.语音库的设计已经有明确的体系,关键难点在于如何去找到一个合适的算法去提取声学特征,语音信号的特征提取是语音情感识别的重要一环,其作用是通过一定的技术手段从原始的语音音频信号提取出目标信息的特征数据,用以送入相应模型进行模型训练和语音情感分类。目前语音于语音情感识别的声学特征大致可归纳为韵律学特征、基于谱的相关特征和音质特征三种,而声学提取特征又存在mfcc特征提取和深度学习特征提取,不同的方法会影响到语音信号的提取是否纯净,我们需要结合当前研究现状和效果优劣后,选择合适的方法来提取声学特征。
3. 国内外研究现状(文献综述)
1.文献综述
4. 研究方案
完整的情感语音识别设计需要先创建语音库,再在语音库中的样本进行有效采集,通过预处理得到所需要的部分,最后进行情感识别,如图1。
图1:情感语音处理总流程图
5. 工作计划
2022-2023-1学期第15-16周,完成选题,查阅相关中音文资料,进行dbn模型的学习;
第17周,与导师沟通进行总课题规划;
第18周,导师下发毕业设计(论文)任务书,根据导师的要求进行外文翻译,列出开题报告大纲;
课题毕业论文、文献综述、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。