音频编码:入门看这篇就够了丨音视频基础 对音频或视频进行编码最重要目的就是为了进行数据压缩,以此来降低数据传输和存储的成本。 拿音频来举例,一路采样率为 44100 Hz,量化位深为 16 bit,声道数为 2 的声音,如果不进行编码压缩,对应的码率是:。一分钟的时间所需要的数据量是:。 对于单单一路音频来说,这个数据量还是比较大的,在存储或传输时如果能进行压缩编码,可以一定程度上提高效率。 通常,对信息进行压缩,可以从这几个方面着手:1)信源包含的符号出现概率的非均匀性,使得信源是可以被压缩的。熵编码就利用信源的统计特性进行码率压缩的编码方式。比如著名的哈夫曼编码(也是熵编码的一种),就是当信源中各符号的出现概率都一样时编码效率最低。2)信源的相关性,使得信源是可以被压缩的。比如信息 A 和信息 B 的相关性,使得我们可以由信息 A 加残差 D(D = A – B) 来推导信息 B,这样只编码 A 和 D 来实现压缩,这就是所谓的差分编码技术。3)人的感知对不同信源的敏感度不一样,使得信源是可以被压缩的。对人感知不敏感的信息进行部分或全部忽略来实现压缩。 要对音频数据进行编码压缩,主要是寻找音频数据中的冗余信息对其进行压缩: 1)时域冗余 音频信号时域上的冗余主要表现为下面几个方面:幅度分布的非均匀性:统计表明,在大多数类型的音频信号中,小幅度样值出现的概率比大幅度样值出现的概率要高。人的语音中,间歇、停顿等出现了大量的低电平样值;实际讲话的功率电平也趋向于出现在编码范围的较低电平端。样值之间的相关性:对语音波形的分析表明,相邻样值之间存在很强的相关性。当采样频率为 8k Hz 时,相邻样值之间的相关系数大于 0.85。如果进一步提高采样频率,则相邻样值之间的相关性将更强。因此,根据较强的维相关性,可以利用差分编码技术进行有效的数据压缩。信号周期之间的相关性:虽然音频信号分布于 20-20k Hz 的频带范围,但在特定的瞬间,某一声音却往往只是该频带内的少数频率成分在起作用。当声音中只存在少数几个频率时,就会像某些振荡波形一样,在周期与周期之间存在着一定的相关性。利用音频信号周期之间的相关性进行压缩的编码器,比仅仅利用邻近样值间的相关性的编码器效果好,但要复杂得多。静止系数:两个人之间打电话,平均每人讲话时间为通话时间的一半,并且在这一半的通话过程中也会出现间歇停顿。分析表明,话音间隙使全双工话路的典型效率约为 40% (或称静止系数为 0.6)。显然,话音间隔本身就是一种冗余,若能正确检测出这些静止段,可以进行压缩。长时自相关性:统计样值、周期间的一些相关性时,在 20 ms 时间间隔内进行统计的称为短时自相关函数。如果在较长的时间间隔(如几十秒)内进行统计时,则称为长时自相关函数。长时统计表明,当采样频率为 8k Hz 时,相邻的样值之间的平均相关系数可高达 0.9。这样的相关性也可以进行压缩。 2)频域冗余 音频信号频域上的冗余主要表现为下面几个方面:长时功率谱密度的非均匀性:在相当长的时间间隔内进行统计平均,可以得到长时功率谱密度函数,其功率谱呈现明显的非平坦性。从统计的观点看,这意味着没有充分利用给定的频段,或者说存在固有的冗余度。功率谱的高频成分能量较低。语音特有的短时功率谱密度:语音信号的短时功率谱,在某些频率上出现峰值,而在另一些频率上出现谷值。这些峰值频率,也就是能量较大的频率,通常称其为共振峰频率。共振峰频率不止一个,最主要的是前三个,由它们决定不同的语音特征。另外,整个功率谱也是随频率的增加而递减的。更重要的是整个功率谱的细节以基音频率为基础,形成了高次谐波结构。 3)听觉冗余 人是音频信号的最终用户,因此,要充分利用人类听觉的生理和心理特性对音频信号感知的影响。利用人耳的频率特性灵敏度以及掩蔽效应,可以压缩数字音频的数据量:可以将会被掩蔽的信号分量在传输之前就去除,因为这部分信号即使传输了也不会被听见。可以不理会可能被掩蔽的量化噪声。可以将人耳不敏感的频率信号在数字化之前滤除,如语音信号只保留 300-3400 Hz 的信号。人耳的掩蔽效应包括下面几种:最小可闻阈值:一个频率的声音能量小于某个阈值之后,人耳就会听不到。频率掩蔽效应:当有能量较大的声音出现的时候,该声音频率附近的其它频率的人耳可听阈值会提高很多,这样就会导致人耳听不到这些频率低于阈值的信号,即这些信号被掩蔽。时域掩蔽效应:当强音信号和弱音信号同时出现时,可能会发生前掩蔽、同时掩蔽、后掩蔽。前掩蔽是指人耳在听到强信号之前的短暂时间内,已经存在的弱信号会被掩蔽而听不到。同时掩蔽是指当强信号与弱信号同时存在时,弱信号会被强信号所掩蔽而听不到。后掩蔽是指当强信号消失后,需经过较长的一段时间才能重新听见弱信号。这些被掩蔽的弱信号即可视为冗余信号。 














2024最新激活全家桶教程,稳定运行到2099年,请移步至置顶文章:https://sigusoft.com/99576.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。 文章由激活谷谷主-小谷整理,转载请注明出处:https://sigusoft.com/72084.html