1、影响语音质量的因素
语音通信系统中,影响语音质量的因素包括延时(delay)、丢包(packet loss)、包延迟变化(packet delay variation)、回声(echo)、以及由于编码造成的失真。将影响语音质量的因素分成三类,第一类是造成Listening Difficulty的因素,第二类是造成Talking Difficulty的因素,第三类是造成Conversational Difficulty的因素。
Listening Difficulty: 主要有丢包、编码造成的失真、speech clipping(不知如何准确翻译)以及回声。丢包是指语音帧未送达的百分比例。超过5%就会语音质量的严重下降。而speech clipping发生在信号丢失的任何时间,在连接过程中,发生了丢包,或者是对语音进行的VAD(Voice Activity Detection)过程。都有可能导致speech clipping.
Talking Difficulty:主要是回声和侧音(sidetone)-- 侧音是通信术语,通常指在终端设备(例如)中,发端信号经处理后,其中一部分回馈到自身接收电话的那部分信号。 在电话机中,原始话音通过把声音信号转化为电信号,经通信线路一路传送到对方,一路回传到本方,使讲话人能听到自己的声音,这就是侧音。
Conversation Difficulty: 时延。
2、语音质量评价的方式
主观测试(subjective Tests)
对于Listening quality,下图是MOS中的标准
客观测试(Objective Tests)
有两个指标用用来评价语音质量,一个是相关系数,另外一个是RMSE