详情

智能语音识别匹配算法优化设计

申报人:封士娇 申报日期:2021-12-08

基本情况

2022校院级项目管理
智能语音识别匹配算法优化设计 学生申报
创新训练项目
工学
自动化类
学生自主选题
一年期
近年来,由于计算机功能的日益强大,存储技术、语音算法技术和信号处理技术的长足进步,以及软件编程水平的提高,语音识别技术已经取得突破性的进展。语音识别是以语音为研究对象,通过语音信号处理和模式识别让机器自动识别和理解人类口述的语言。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。本项目通过对语音识别的分析,将口述语音转换为代码,进而通过匹配代码识别正确的语音。
江苏省机器人大赛三等奖

1.指导教师读研研究相关课题方向,并发表SCI一篇,EI两篇。

2.指导教师带过近十年毕业设计,每年都有相关课题方向。

3.指导教师带过三届大学生创新实践,每年都有相关课题方向。

4.指导教师带过的大学生创新实践活动,所指导的学生已发表论文4篇。

1.能够及时帮助学生答疑解惑;

2.调节组内氛围,推动项目顺利进展;


校级

项目成员

序号 学生 所属学院 专业 年级 项目中的分工 成员类型
封士娇 机械与电气工程学院 自动化(本科) 2019 调试,论文编写
姜秋钰 高等职业技术学院 电气工程及其自动化(单招本科) 2021 资料收集
陈俊涛 高等职业技术学院 电气工程及其自动化(单招本科) 2021 资料收集

指导教师

序号 教师姓名 所属学院 是否企业导师 教师类型
常恒 机械与电气工程学院

立项依据

语音识别研究的目的就是让机器“听懂”人类口述的语言。包括两方面的含义:其一是逐字逐句听懂非转化成书面语言文字;其二是对口述语言中所包含的要求或询问加以理解,做出正确响应,而不拘泥于所有词的正确转换。语音识别系统从讲叙方式角度可分为孤立词、连接词和连续语音三种。从服务对象的角度可分为特定人与非特定人。即系统只针对一个用户或可用于任意用户。

1、自然语言:如听写机、翻译机、智能计算机中的人机语音对话都需要连续语音识别。

2、按词汇的多少可分为小、中、大三种字表。

3、按对说话人的限制可分为特定人、限定人和非特定人识别系统。对于特定人语音识别,系统启用前,由特定人口呼待识词或指定字表,系统建立特征库。之后即可口呼待识词。这样的系统只识别训练者的声音。

4、如果需要有限的几个人使用同一系统,可以研制成限定人识别系统。如果一个系统不必经使用者训练就可以使用,称为非特定人语音识别。这样的系统应能适应各种发音者,使用方便。


我国语音识别的发展起步于五十年代。根据汉语的单音节以及音节个数固定的特点,我国研究者提出了汉语音节识别方法。中国科学院声学所于1978年推出第一个实时语音识别系统。随后,哈尔滨工业大学的微机语音识别接口于1983年通过鉴定。1984年,中科院自动化所根据汉语的特点,将声母和韵母分开识别,取得了很好的效果,至今仍有许多识别系统采用该方法。从八十年代末到九十年代初,一些中、小词表的语音识别系统已投入实际使用。
近十几年来,我国的语音识别研究也向大词汇量、非特定人、连续语音方面发展,并得到政府和各基金部门的关注和大量资助。国家863智能计算机专家组于1998年4月组织了对国内大词汇量连续语音识别系统的评测。清华大学电子工程系的语音识别系统获得了最好的成绩:字正确率为93%,句子正确率62.5%,其结果和IBM语音识别系统水平相当。中科院自动化所研制的非特定人、连续语音听写系统和汉语语音人机对话系统,字准确率和系统响应率达90%以上。这些成果表明我国的语音识别研究已接近国际水平。

国际上对语音识别的研究正趋于商品化和实用化,移动互联网的兴起成为ASR最重要的应用环境之一。在Google引领下,互联网、通信公司纷纷把语音识别作为重要研究方向,包括Android系统内嵌语音识别技术、Google语音翻译、iPhone4S上的Siri软件等。
随着用户对语音识别系统性能的要求不断增加,新的问题不断出现,语音识别技术必须不断改进。新技术和新理论仍在不断涌现,必将进一步推动语音识别技术的发展。

1、语音识别匹配技术深入千家万户,与生活紧密联系;

2、在已有基础上优化匹配算法,提高效率;

3、语音识别就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。人们预计,未来10年内,语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。

1、克服在知识储备上的匮乏;

2、语音识别误判问题;

预期成果:

1、精准匹配;

2、优化算法;

3、撰写论文;

2022年1月-2月:设计方案

3月-6月:设计算法

7月-9月:优化算法,实现仿真

10月-11月:调试

12月:撰写论文,结题


Matlab课和机器视觉课程所学相关内容,并有一定的实践基础。

对于算法的基本了解,对语音识别技术的大体了解 

熟悉MatlabC语言的操作,会运用相关算法进行图像处理。

1、缺少性能较好的设备

2、科研资料的查询途径

经费预算

开支科目 预算经费(元) 主要用途 阶段下达经费计划(元)
前半阶段 后半阶段
预算经费总额 2000.00 250.00 1750.00
1. 业务费 1750.00 100.00 1650.00
(1)计算、分析、测试费 0.00 0.00 0.00
(2)能源动力费 0.00 0.00 0.00
(3)会议、差旅费 250.00 100.00 150.00
(4)文献检索费 0.00 0.00 0.00
(5)论文出版费 1500.00 0.00 1500.00
2. 仪器设备购置费 0.00 0.00 0.00
3. 实验装置试制费 0.00 0.00 0.00
4. 材料费 250.00 150.00 100.00
结束