1.4.3 感观:等响曲线(ELLC [Equal Loudness-Level Contour])

等响曲线(ELLC [Equal Loudness-Level Contour]) 是反映在面对指定常量响度的稳定纯音时,人耳对各纯音基波频率下的响度感知最小临界点情况 [12] 。作为心理测量值,最终的结果是基于多组样本测量结果所得的 平均值

等响曲线的测量

有记录可查的最早心理声学测量结果,来自 哈维·弗莱彻(Harvey Fletcher,1884~1981)怀尔登·芒森(Wilden A. Munson,1902~1982) 于 1933 年发表的 “响度、其定义、测量和计算” 一文 [13] 。正是该论文,奠定了等响曲线的基本测量方式

弗莱彻和芒森对于每个频率和强度,以选取的 1000Hz 参考音 为基准。调整参考音的响度,直到听众认为它与测试输入的 “稳定纯音” 响度相同,作为一次有效记录标准。统计了大量样本。

测量中,样本指的是不同的受试者。所以样本的基数决定了标准的有效程度。而样本的输入所用的 “稳定纯音”,则指的是在 固定响度下 的一组,按照基音以一定频率步长 (一般是取三分之一个八度递增,或以 10Hz 递增,前者居多)从人听力下限 20Hz 开始递增至 20000Hz (ISO 226 系列因采用音调测量,频率递增是非等步长的,范围为 20~12500Hz [14] )的 所有纯音音调

因此,假设选用了 [0, 20, 40, 60, 80, 100][0,\ 20,\ 40,\ 60,\ 80,\ 100] 共 6 组固定响度,选择 10Hz 频率步长。则每组有 1999 个纯音输入,共记 6×1999=119946 \times 1999 = 11994 个输入。当然,一般统计采用的是三分之一八度递增,不会有如此多且密集的输入。

虽然样本存在差异,但是输入却可以在一定程度上客观的表示,以减小个体不同造成的误差。在本书前面的章节已经介绍了, 单一音调声音都是复合音(Complex Sounds)。而其 和声(Harmony) 可看作是由一系列不同基音频率下的一组纯音,将各自谐波链按响度叠加组合而成

这一理论可以延生至自然界中其他种类声音的合成,即声音的合成就是泛音链的合成。当然,也可以作用于 非标准音程(Interval) 的特殊单一音调合成。

频律响度特征(FLF [Frequency Loudness Feature])

我们可以通过以横坐标为频率而纵坐标为响度,将构成某一时间点上的一个单音的所有频率成分,拆分到各频率混合后的响度标识状态了。

而形成的频率响度曲线,为了 区别于乐理 中的和弦和声相对未量化响度的概念,被称为 该单音在该时刻下频律响度特征(FLF [Frequency Loudness Feature])。通过 FLF,我们可以判断 音色 情况,这点在之前的声音三要素部分时,已有使用。

图 1.4.3-1 某低音(Bass)的频律响度特征(FLF)示意连峰图

在真实场景中,我们很少能拿到指定时刻的存粹数据。所以,一般会 统计一小段时间片 下的 频率响度信息,并通过计算这一段时间片内各频率自身的 响度加合求算术平均,来表示该时间片 中间点的时刻,所具有的 频率响度特征

如下图所示(相关代码实现,参见第五章),响度频率谐波链 情况表露无遗:

图 1.4.3-2 多乐器演奏音调 A4 时在 5s 处取 100ms 所得频率响度特征

频率响度信息的来源,则是 来自对相应时间片内的原音频数据,进行离散傅立叶变换做 时频分离 获取。具体原理,会在本书第三章中进行详细阐述。

FLF 反映的是,指定时刻声音本身的构成。


等响曲线的输入,是以 FLF 为标准,按照选取频率处理所得的指定响度,有相对纯粹谐波链的音调。

等响曲线的最新修订

既然是统计所得,那么等响曲线就存在 迭代标准修订。最新一次修订来自于 国际标准化组织(ISO [International Organization for Standardization]) 在 2023 年发布的 ISO 226:2023 标准。该标准联合了来自世界各地的多家研究机构的综合数据结果,统计了从 18 至 25 岁来自欧美和东南亚的大量受试者测量结果求均值所得,是 国际通用标准

2023 年的再次测量,选择了 [0, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100][0,\ 10,\ 20,\ 30,\ 40,\ 50,\ 60,\ 70,\ 80,\ 90,\ 100] 共 11 组固定响度。以 10 方(Phon)为输入响度步长,统计仍然以从 20Hz 按照 三分之一个八度(One-Third Octave) 递增至 12500Hz 的,每个响度分组包含 29 个音调频率输入。共计 11×29=31911 \times 29 = 319 输入信号 [15]

图 1.4.3-3 ISO 226:2023 标准等响曲线 [15]

上图展示了相应结果,注意,横坐标并非是等频率步长的,而是以音程尺度描述(ISN [Interval Scale Name])标记的 三分之一个八度(One-Third Octave) 步长

最下方的 0 方(Phon)线,表示 人的可听下限,称为 可闻阈(The Threshold of Hearing)。第二小的 10 方(Phon)线,表示人的 最小可辨认下限,称为 静音阈(The Threshold of Quiet)。介于可闻阈和静音阈间的声音,能够听见但不可辨认。最上方的 100 方(Phon)线,则表示 人的听觉痛觉线,称为最大安全听阈上限,或 痛觉阈(The Threshold of Pain)超过痛觉阈的响度,会使人听觉不适并产生 疼痛感,且在持续一段时间后,对人的听力造成 永久性 的损害。

三者都 相对缺少样本,因此采用了 虚线 标记。由 可闻阈 和 痛觉阈 所围成的区域,被称为安全听阈(Safety Hearing Threshold)。


所有的工程技术,按理来说,皆因该在安全听阈范围内进行。避免对人耳造成损害。而我们该如何衡量这一点,并同时检测此类设备是否符合我们期望的标准呢?只需考察其 频率响应(Frequency Response)

Copyright © Since 2021 李述博 (Arikan.Li) , All Rights Reserved all right reserved,powered by GitbookLast Updated: 2024-03-22 18:02:17

results matching ""

    No results matching ""