摘 要:随着中国国际化越来越明显,语言交流成为适应这个大环境下的重要途径。为了能够在有限的条件下提高英语学习者的语言学习效率成为当今亟待解决的问题。本文依据英语发音打分的实际需求,分别采用了待评价和标准两种发音模式,并通过欧式距离来转化为英语发音评分结果。此外,本文还介绍了整个算法的设计理念,并从全局出发,重点分析各个环节。
关键词:语音特征;模式匹配;英语发音
1、引言
英语的学习通常包括:听、说、读、写,每个方面的学习都各有个的特点,而说的能力方面一直以来没有一个较好的方法进行提高,即使存在像英语角这样的场合,但由于种种原因并不能使每一位英语学习者得到提高,并且由于“说”不能单独进行,所以经常会造成学习者积极性下降以至于不能很好地将英语这门语言学好[1,2,3]。
关于计算机英语发音方面的研究,无论是在国外还是在国内很多研究者都做了很多的努力并取得了一定的成果。在国外,Carlos Molina等总结出了一种错误和正确的发音词典生成方法。结果表明人工评分和机器评分结果系数达到了0.82和0.67;Ambra Neri等认为发音评估遇到的问题主要在于计算机技术的研发以及对自动识别语音的认识程度不深,在计算机的程序设计以及算法上加以更新和优化,对英语发音的水平的评分一定能够达到令人满意的效果;Jared Bernstein 等在斯坦福研究院设计了一种通过英语语音识别的学习评分系统,此系统是应用马尔科夫模型的语音识别系统,试验最终表明了专家打分与读者文本的打分的系数达到了0.8以上的水平,其效果显著[4,5]。
目前,国内关于英语发音打分产品在清华大学、中国科学院、中国科学技术大学等研究机构与高校都有研究,比较著名的是Versant,涉及了多个语种,应用到了很多的领域[6]。香港理工大学和中国科学院联合开发了一个关于英语语音测试的评估系统,能够自动的将错误发音进行识别[7];陈清才等人在针对当前英语发音音素系统的不稳定性,提出了关于语法的口语发音自动评估方法 [8];梁维谦结合发音的质量、发音网络生成、评价模型的训练以及发音参数的提取等方面,建立了英语学习系统的发音质量评价系统模型,能够实现资源的开销小和稳定性平稳的目标[9]。
2、语音特征匹配的英语发音评价算法的框架
近年来,如何应用语音特征模式匹配技术来解决英语发音的评判问题成为研究的热点。在比较复杂的情况下,能够清晰的知道对方说话的内容,能够准确的知道对方说话的内容,能极大的增强系统对环境中噪声的适用能力。
基于语音特征模式匹配的英语发音评价算法框架正是完成这样的工作。它是对信息处理在两个通道上相互独立进行的,并将其结果进行加权来得到最终的结果。依据实际英语发音的评分情况,具体过程如下:首选将语音进行分割,并将音素级和待评价的发音与标准发音进行对比,来计算出相似度,其中,以标准模板和待测语音音素的特征之间的距离作为相似度,并通过过公式来进行计算,从而给出评价的分数。具体步骤如下:
①、切割英语发音的音频片段作为输入
②、通过指定的方法将上述片段进行处理,提取出语音特征;
③、应用指定的方法来求出对应的欧式距离
④、通过公式计算来得到最终的评分。
2.1加窗
语音信号在10~20ms的范围内被认为是相对较平稳,将语音的处理片段信号可以分成若干段,每一个段称为从一个持续语音段提取出来的分析帧,处理之后,从原来的语音序列中产生一个新的语音信号特征,一般一个长度的函数截取的语音信号形成的分析帧能够根据不同的应用,采用几种函数来进行逼近,从而达到比较理想的频率响应。
1.一个N 点的方函数公式:
ω(n)=1 0≤n≤N-10 其它 (1)
2.一个 N点的汉明函数公式:
ω(n)=0.54-0.64cos(■) 0≤n≤N-10 其它 (2)
3. 一个 N点的哈宁函数公式:
ω(n)=0.42-0.5cos[2πn/(N-1) ]+0.08cos[2πn/(N-1) ] 0≤n≤N-10 其它 (3)
2.2预加重
为了对语音的高频部分进行加重,本文采用了预加重来增加语音的高频分辨率。口鼻辐射影响和声门激励主要影响语音的信号评分功率谱,当在800Hz以上,这种高频率以6dB/oct进行快速的衰减。此时要对此进行进行滤波,对应滤波器的传递函数:
Hz=1-αz-1 (4)
其中,预加重系数为α , 0.9<α<1.0,通常取0.97。
3、总结
中国有数以亿计的英语学习者,机器学习已经成为这个产业新的爆发点。英语发音打分算法为学习者提供了一个更加轻松环境和低成本的投入。一方面鼓励学生“大声说出来",一方面为他们提供有效的评分反馈,指出发音中的具体错误,帮助他们进行有针对性的训练。除了进阶式口语训练体系之外,今后的研究可关注在使用机器学习的方法进行口语自动评分等方面。
参考文献
[1]陈彩华,龙卫兵.基于ARM-Linux的普通话发音质量评价体系[J].计算机系统应用,2011,20(9):92-96.
[2]Rebeeea H. ComPuter support for learners of spoken English[D]. Stockholm: The Royal Institute of Technolgoy, 2005.
[3]黄洁.中式英语剖析——from Chinglish to English[J].现代交际,2011,(8).
[4]赵力.语音信号处理[M]. 机械工业出版社,2011.
[5]孙菲.计算机辅助教学环境下的英语口语学习策略研究[D].济南:山东大学,2008.
[6]孙雪.国际音标符号系统之元音声学特征分析[D]. 南开大学 2009.
[7]董滨.基于共振峰模式的汉语普通话中韵母发音水平客观测试方法的研究[J].声学学报:2007,32(2),111-119
[8]梁维谦,王国梁,刘加等.基于音素的发音质量评价算法[J].清华大学学报(自然科学版),2005,45(1):9-12
[9]严可.英文朗读题及复述题自动评测技术研究田.合肥:中国科学技术大学,2009.