[分享] 声品质分析之基本评价量

Hanspace 2023-11-14 11:38 楼主

声品质分析：基本评价量

引言

当人们对噪声特性获得一定认知度后，听觉系统就会在噪声物理特性和发声体的功能与品质等方面形成特定的感知联系，并形成特定的心理感知需求和期望。人们对这种现象的关注是噪声研究由声级声学（物理方面）向声品质（心理方面）发展的直接源动力，反映了科学研究由客观参量走向主观参量，由唯物的研究进入“以人为本”的研究的发展趋向。自上世纪九十年代以来，声品质的概念被创造和定义，并成为国际性的新兴研究领域和研究热点。

被国际学术界广泛认同的完整的声品质定义首先由Blauert给出：“声品质是在特定的技术目标或任务内涵中声音的适宜性”。声品质定义中的“声”并不是单纯指声波这样一个物理事件，而是指人耳的听觉感知，“品质”指由人耳对声音事件的听觉感知过程并最终做出的主观判断。Blauert的定义给出了声品质概念的三方面内涵。首先是称作“声品质元素”的发声部件，例如剃须刀中的马达、刀片、支架、腔体；其次是听觉感知，使用者暴露于机器发射的可听频率声波的声场中，并听到声音，开始其听觉感知的过程，这一过程构成了声品质概念中的“听觉事件”；最后是使用者根据对某种机器（发声体）的心理期望，判断机器发射声音的优劣，在这一过程中加入了使用者的认知和心情等主观因素。主观判断的前提是使用者或心理声学中的受试者（统称为评价者或评价主体）对机器的噪声发射有先验的了解或知识，并具有明确的对噪声特征的心理期望，这样受试者才能将听觉事件与噪声的心理期望特征进行比较，从而做出声品质优劣的判断。声品质的形成过程可以用图1表示。

图1 声品质形成过程

从声品质的定义中可以看出，声品质并不是一种发声体或机器内在的量。因而，声品质不能简单地描述为物理量，而必须通过人参与到听觉事件中，并根据主观心理期望进行判断，才能产生声品质。所以，声品质研究必须注重人类听觉的心理学特征和过程。

从心理学的角度来看，声品质具有以下三方面的特征：

（1）激励响应相适性，即声音的刺激与人耳听到声音后所做出的反应及行为要一致；

（2）声音的舒适性，即声音要给人带来满意、愉快以及轻松的享受；

（3）声或声源的可识别性，即赋予声音的涵义能被正确辨别和诠释。

声品质基本评价量

在声品质评价中，有一系列基本特性量被认为适宜于描述听觉事件，主要包括：响度、尖锐度、粗糙度、波动度和音调度等。

1.1 响度（Loudness）

响度是对声音强度的一种感受，是人们对声音感知影响最大的一个参考量。声音的响度不仅与声压级相关，还与声音的频率相关。下图为著名的弗莱彻-蒙森曲线（Fletcher–Munson curves），即等响曲线。等响曲线的横坐标为频率，纵坐标为声压级。在同一条曲线之上，所有频率和声压的组合，都有着一样的响度。最下方的曲线表示人类能听到的最小的声音响度，即听阈。等响曲线反映了响度听觉如下特点：

声压级愈高，响度一般也愈高；
响度与频率有关，相同声压级的纯音，频率不同，响度也不同；
对于不同频率的纯音，提高声压级而引起的响度增长，也有所不同。

图2 等响曲线

通过对响度及其依赖关系以及掩蔽效应的研究发现，对于两个频率不同的纯音A和B，将其叠加成复合音C，C的响度与A、B之间的频率间隔存在直接关系。如果纯音A、B在同一临界带内，则两者的频率间隔越大，复合音C的响度越大；当A、B的频率间隔超过临界带宽时， C的响度将等于A、B响度之和，此时两纯音之间不再相互影响。因此在构造响度模型时，把激励声级对临界带率模式作为基础。将总响度L看成是特征响度L'对临界带率的积分，即：

1.2 粗糙度（Roughness）

当声音的调制频率在15~300Hz范围内即可产生粗糙感，并非要周期性调制，这是大多窄带噪声即使没有包络和频率的周期性变化，也能产生粗糙感的原因。将调制频率为70Hz，调制幅度为100%，声级为60dB的1kHz纯音粗糙度定义为1 asper。

频率分辨率和时间分辨率是影响粗糙度的两个主要因素。频率分辨率由激励模式或特征响度随临界带的关系决定。当调制幅度为25%时，粗糙度达到其最低值0.1 asper，调制幅度每增加10%，相应粗糙度增加17%，因此将可听粗糙度划分为20个级别。当粗糙度变化1.56倍时，我们即可察觉到粗糙度的差异。

粗糙度是由激励模式随时间变化引起的，非常缓慢的变化不会产生粗糙度的感受，可见粗糙度正比于变化速度，即调制频率。此外，通过掩蔽分析可知，粗糙度与掩蔽深度成正比关系。

1.3 尖锐度（Sharpness）

尖锐度是描述高频成分在声音频谱中所占比例的物理量，它反映了人们主观上对高频段声音的感觉，反映了声音信号的刺耳程度。声音的频谱成分、中心频率和声音的带宽都会对声音的尖锐度产生影响，而声音的频谱包络对尖锐度的影响最为显著，相比之下频谱细部结构对尖锐度的影响则不那么明显。在一个临界带宽内带宽的变化与尖锐度无关。

从心理声学的角度来看，频谱包络表示激励声级与特征频带率的关系模式，或称为特性响度与特征频带率的关系模式。根据窄带噪声的尖锐度随特征频带的变化关系，以及低频成分的增加可降低尖锐度的特点，可以采用冲量因子g来构造尖锐度模型，在16Bark以下的频带g为1，而在16Bark以上的频带g大于1。采用特性响度与特征频带率的关系模式作为分布函数，可以构造出如下的关系式：

式中，L'(z)为临界频带（Critical Band，CB）内响度密度的积分，比例常数C=0.11，根据1kHz声压级为60dB时，尖锐度为1 acum来确定。

1.4 波动度（Fluctuation Strength）

听觉系统对经过调制的声音有两种不同的感觉：当调制频率在20Hz以下感知为波动度，而在高频则感知为粗糙度。在20Hz附近是听觉感知的平稳过渡区域。将60dB频率为1kHz的纯音，以4Hz纯音进行幅值调制，调制度为100%声音的波动度定义为1 vacil。波动度呈调制频率的带通特性，最大值在调制频率为4Hz处，即4Hz的调制频率将产生较大的波动度。人耳听觉系统的频率分辨率为4Hz，流利语音的正常速率为４音节/秒。

1.5 音调度（Tonality）

音调度是一种心理声学指标，表示音调分量在其周围频率成分中的相对比重，从而确定其对声音感知的贡献。量化音调度意味着将人耳对声音的“音调”感知转化为客观指标。声源的音调度是提高产品声音品质的主要指标之一，在汽车、航空、铁路或消费品等工业领域中被广泛使用。

表1 音调度指标

总结

随着现代科技的进步，人们愈加注重生活品质，声品质测试的应用在各个行业中也愈加广泛。当新产品面临上市时，需要对其进行声品质测试，以确保其有较强的竞争力。NTS.LAB声品质分析模块具有强大且全面的信号处理能力，该模块不仅包含上述基础声品质分析功能，针对不同的参数还具有多个可选的计算标准，包括国标、ISO标准、ECMA标准、美标、德标等。同时NTS.LAB还提供了其他丰富的声品质计算功能，例如高分辨率谱分析（HSA）、听觉模型谱分析（HMS）、语音清晰度指数（AI）、语言可懂度指数（SII）等，能够从多个角度、多个方向对产品进行声品质分析，从而了解产品各指标的特点，并充分考虑这些指标的局限性和不足之处，针对具体情况进行选择和结果判断，从而对其声品质进行改善。