1.3.1 音高(Pitch)
音高(Pitch) 是代表声音振动频率高低的 主观感知量(Subjective Perceptions),是映射自对应声波频率纯客观物理量的心里声学概念。有时,我们会用 音调/声调(Tone)代指音高的工程名称,这其实不够准确。若发生这种情况,我们就 不能 将代指音高的音调,与乐理中关联音阶(Octave)的音调(Tone)等同。两者存在换算但并不是一个概念。
即,音高(Pitch)不是音调/声调(Tone),更不是音阶(Octave)。
美(Mel [Melodies])& 美体系(Mel Scale)
音高的单位是 美(Mel [Melodies]),这是一个主观标定的单位。以 美(Mel)单位来衡量音高的系统,被称为 美体系(Mel Scale)。该体系来自于美国心理学家 史丹利·史密斯·史蒂文斯(Stanley Smith Stevens,1906-1973) 于 1963 年进行的有关心理声学定量的研究 [4] 。所以, 不属于 当前 国际通用的计量体系单位(SI Unit [International System of Units])。
不过,凭借 美体系(Mel Scale) 在人耳感知上相对生理准确的量化,和本身在出发点设定上存在和频率(Frequency)之间的 直接函数映射。所以,美(Mel)常被选定为统一单位,在声学工程上作基础标的。记美体系音高为 ,频率为 ,有 1963 的早期换算(现已废弃):
这是以 1000 Hz 响度为 40 dB(声压级)的纯音(即只包含一个频率)为 1000 Mel ,来测算拟合得到的经验公式。受限于检测设备,会存在一定的误差。
因此,该公式对应拟合方式,在随后的 1968、1976、1990 年,分别经历了三次较大程度的重测。而现在我们采用的主要有 两套转换标准。
一个是由 道格拉斯·奥肖内西(Douglas O'Shaughnessy) 在 1976 年修订的 1000Hz 基准(1000 mel)按 700Hz 分割转换标准 [5] ,被称为 奥肖内西美体系(O'Shaughnessy's Mel Scale) :
另一个则是 1999 年由 MATLAB 主导的修订结果 [6] ,被称为 斯莱尼美体系(Slaney's Mel Scale)。这也是 librosa 库采用的算法,有:
两者差异,如下图:
相对来说,在不存在体系换算的条件下,会优先选择 奥肖内西 转换公式。而当存在系统换算,尤其是涉及 librosa 库时,建议优先以统一体系为要求,采用相同体系的转换公式。
需要注意的是,美体系都是对单一频率纯声的转换。而什么是频率呢?
频率(Frequency)
频率(Frequency) 是指声音对应机械波属性的源振动频率。是声音三要素中唯一的纯客观物理量。当然,一般我们所称的声音的频率,都是指可被感知的声音频率,即前文提到的 狭义声波(Narrow Acoustic Wave) 范围的 可听频率(AF [Audible Frequency])。
频率的单位是 赫兹(Hz [Hertz]),表示单位时间一秒内,振源发生完整周期性往复运动的次数,即 。假设存在波长为 ,波速为 的波,有相应周期为 ,频率为 ,则:
在标准大气压的理想空气介质中,人类能够听见并识别大约 20Hz~20000Hz 频率范围的声波。有 AF 属于 20Hz~20000Hz。
以此为基准, 频率小于 20Hz 范围的声波,被我们称为 次声波(Infrasound)。而 频率大于 20000Hz 范围的声波,被我们称为 超声波(Ultrasound)。次声波和超声波都是相对于人而言的 单阈范围域。
即然被归为声音三要素,就表示人对不同频率声音的听感有不少差异。在假设其它影响量不变的理想情况下,本书查阅了一些基于日常关联心理声学测量的结果,汇总如下表以供参考:
Frequency(Median) | Object | Feelings Description(Subjective) |
---|---|---|
20Hz | 发动机 <飞机引擎、高速引擎> | 汽车呼啸而过的轰鸣声 |
25Hz | 大提琴的最低音调 | 类似低音炮发出的震撼 |
50Hz | 洗衣机的运转时 | 洗衣机正常工作时的声响 |
100Hz | 柜式冰箱运转时 | 柜式冰箱压缩机工作的声响 |
200Hz | 剧院环境男低音 | 低沉浑厚的歌声 |
500Hz | 轮播式电话铃声 | 是种清脆响亮的声音 |
1000Hz | 钢琴中音C大调 | 更为清脆明亮的声音 |
2000Hz | 剧院环境女高音 | 高亢嘹亮的歌声 |
4000Hz | 蚊子飞行时 | 嗡嗡且恼人的脆鸣声 |
8000Hz | 发光二极管示波器 | 实验室示波器工作的声响 |
12000Hz | 成熟家犬 | 狗吠叫警示时的吼声 |
18000Hz | 超声波清洗器 | 清洗器工作时的吱吱声 |
从上表可知,以听感角度考虑会十分的主观。但请不要忘记,频率本身是客观的。上述统计中采用的,是由选定样本声音中,所包含的所有频率声波的 复合频率中值(Median)。自然界中大部分声音 并非 由 单一 频率波构成。这也是产生不同音色(Timbre)的原因之一。
观察例举的统计结果,会发现直觉上非常吵闹的声音,如飞机发动机的声音,其频率并不一定高。而一些我们生活中感觉难以察觉的声音,如蚊子飞行声,却不一定低频。
显然,频率并不能代表声音的高低。我们还需要其它参数表示,那就是 响度(Loudness)。