我们知道,人眼有“视觉暂留”现象:影像消失后,人眼仍能保留影像100毫秒~400毫秒。这就是电影的原理,每秒播放24张图片,影像就动起来了。
我就想问,那么有没有“听觉暂留”呢?我们听到的声音是连贯的,有没有可能其实也是一个个分离的片断?
查了一下,还真有听觉暂留,叫做“哈斯效应”。如果两个声音相隔5毫秒~35毫秒之间,人耳会认为这是一个声音。
相比“视觉暂留”的至少100毫秒,“听觉暂留”要短得多,最短只有5毫秒,足足相差了20倍。
我猜想,这会不会跟信息的传输速度有关。视频的信息量比较大,音频的信息量比较小,如果人体神经系统的信号传播速度是恒定的,那么传输视频就会多耗时。为了把所有视频信息传输完,视觉就暂留久一点。
一个有趣的经验是,4分钟的 MP3 文件(44.1kHz 抽样)体积大概是 4MB 左右,而4分钟的 1080P 视频(H.264编码)体积是 80MB 左右,相差也约是20倍。