所在位置:首页 > 技术学习 > 软件应用

Waves 小贴士:耳机中的 3D 音频

学习为什么在真实世界中听 3D 声音和在耳机中听是两种完全不同的体验,并且怎样才可以减小它们之间的差别。
真实世界中的空间声音的感觉是一种很复杂的现象,它结合了原声声波和房间或空间之间的相互作用的结果,这个相互作用取决于我们的头和耳朵,也就是你的中耳和内耳与听觉神经的反应作用,最后在我们的脑中体现出我们理解出的和认知里的原声场景。
在耳机中声音的感觉是一种完全不同的体验。比如我们对比一下立体声耳机和音箱,它们有以下几点不同:
1. 通道串扰:立体声的魔法当我们听到的是一个左/右音箱的结构,信号从左边的音箱到达我们的左耳和右耳,并且和右边的音箱输入相加。当我们在耳机里听同样的量,左耳只能听到左声道而右耳也只能接收到右声道的声音。

图一:通道串扰
2. 抬起头!头和耳朵的过滤和延迟在通过空气传播并在到达鼓膜之前,由于我们的头部和耳朵的尺寸和形状,声波会经过一层过滤和延迟。波从耳朵前端会在不同时间和不同频率形状到达耳朵内部,延迟和过滤都会根据声音发出的角度来定。当在耳机里听的时候,这个过滤和延迟效果会本质上是会被过滤掉的,信号会直接达到我们的鼓膜(也要看耳机的型号)。

图二:耳朵过滤:方向相关的频率变化
3. 早期反射:我们不是一个人在真实世界甚至在很干的录音室中,音箱中的声音不是唯一让耳朵听到的声音。声波会受到房间里墙的反弹和其他物理物品制造的来自多个方向多个高度的相关信号的影响。这些会作为早期反射信号回馈回来,他们同样也在传输的过程中被过滤和延迟了。我们的大脑会使用增益,到达时间和这些早期反射的方向到直接来源,到来源的预估距离,尺寸和独特声学的聆听空间。所以,在使用耳机的情况下,这些都不会发生。只有干信号会直接进入耳朵,没有任何会跟物理环境产生相互作用的迹象。

图三:早期反射
4. 头部移动:『它动啦!』由于上面所有讲的现象都是取决于声音的方向,所以即使对我们头部的轻微移动都会导致完整的音频场景向相反方向移动,因为外部世界不会随着头部移动。现在,这个提示跟其他任何信息一样重要,甚至更重要。我们的大脑,对变化非常敏感,它可以记住声音之前在哪里和现在在哪里,将它与它本身(而不是来源)移动的认知相结合,并使用这些信息来定位静态的外部来源。当我们在耳机上聆听时,音频场景随着头部会不断移动,和大脑对于声源的位置保留的任何先前假设互相矛盾。

图四:头部移动以上所有的都是大脑使用的命令性提示,从而来不断地决定声源的位置。
现在我们的大脑不会轻易地来决定一件事儿了,它并不会轻易被骗。它已经通过数百万年的进化发展到了可以来定位声音的能力。通过聆听发现可能的潜伏的捕食者或捕获猎物对于生存是至关重要的,当声音线索确实或矛盾时,大脑会变的非常困惑,直到它最终放弃了尝试寻找声音,头部对于场景的建立也会崩溃。这是使用耳机的经验,由于帮助我们定位空间中声源的提示丢失了,所以我们听到的声音感觉像把它们嵌在了头里面。我们听到的所有元素都是沿着二维空间从耳朵到耳朵而不是三维空间从外部空间到头部。

图五:三位空间音箱立体声画面

图六:普通耳机的水平立体声画面
普通耳机体验的水平度可能有几个负面后果:
空间图像错误或缺失:当你在使用耳机听声音时,我们不能感知或是会误解制作人或是录音艺术家想要传达的混音的空间构造。 比如说,在披头士歌曲『生命中的一天』(『A Day in the Life』)中,人声从右声道开始,左声道是钢琴。然后在歌曲的第一句诗词中,它们逐渐向反方向移动,直到第二句诗词完全交融。这是听觉体验的重要部分,当我们通过音箱体验时,我们可以听到在听觉空间中正常发生的传送。听到具有平坦声音的耳机上的歌曲将不会正确地再现这个听觉场景,并且将这个体验大大减少。
混音决定:当您在耳机上混音时,空间隐射的抵触作用可以被感知为频率或相位差。这可能导致声音工程师做出不正确或夸张的 EQ 和/或混音决定,在音箱播放一次这轨就会听得非常明显。
听力疲劳:由于大脑不习惯这种类型的听感,在耳机上产生的内耳长期听感可能会导致听力疲劳。我们的蛋是在一直不断试图理解空间音频的场景,但是一直找不到就会让大脑处于不断的迷失状态。
环绕声:实际上,我们是不可能在普通耳机上创建环绕声的,主要是因为它们无法传送位于听众后面的音源的环绕听感。Waves Nx 技术已经开发出整合外部听音效果和耳机之间的差别的插件,Nx 算法将上述所有丢失的东西插入到型号中,来说服大脑声音,这些声音来自空间中的虚拟音箱的位置,并且有立体声和环绕声的选项。

图七:Nx 里的耳机 3D 立体声效果画面图

图八:Nx 里的耳机 3D 环绕声效果画面图
Nx 用了很细微的变化来做这些效果,仅仅添加所需要的关键步骤和全局听感以便重新创建空间 3D 的音频画面,而不修改或染色声音。过滤器和环境音被优化来创建透明声音的房间,以便使用最小化的频率变化,来让所有变化被感知为与空间相关而不是与效果相关。通过将声音调节到用户的头部运动一致,来创建 3D 感知,并且没有对频率响应做明显的改变。

 

转自《midifan月刊》2016年10月第127期

打印此页】【返回首页】