声音其实是一种能量波,因此也有频率和振幅的特征,频率对应于时间轴线,振幅对应于电平轴线。
波是无限光滑的,弦线可以看成由无数点组成,由于存储空间是相对有限的,数字编码过程中,必须对弦线的点进行采样。很显然,在一秒中内抽取的点越多,获取得频率信息更丰富。
音频采样率
音频采样率(Audio Sample Rate)是指录音设备在一秒钟内对声音信号的采样次数,采样频率越高声音的还原就越真实越自然。
人耳能够感觉到的最高频率为20kHz,因此要满足人耳的听觉要求,则需要至少每秒进行40k次采样,用40kHz表达,这个40kHz就是采样率,我们常见的CD,采样率为44.1kHz。
- 8,000 Hz – 电话所用采样率, 对于人的说话已经足够
- 11,025 Hz
- 22,050 Hz – 无线电广播所用采样率
- 32,000 Hz – miniDV 数码视频 camcorder、DAT (LP mode)所用采样率
- 44,100 Hz – 音频 CD, 也常用于 MPEG-1 音频(VCD, SVCD, MP3)所用采样率
- 47,250 Hz – 商用 PCM 录音机所用采样率
- 48,000 Hz – miniDV、数字电视、DVD、DAT、电影和专业音频所用的数字声音所用采样率
- 50,000 Hz – 商用数字录音机所用采样率
- 96,000 或者 192,000 Hz – DVD-Audio、一些 LPCM DVD 音轨、BD-ROM(蓝光盘)音轨、和 HD-DVD (高清晰度 DVD)音轨所用所用采样率
- 2.8224 MHz – Direct Stream Digital 的 1 位 sigma-delta modulation 过程所用采样率
采集过程中我们还必须获得该采样频率的能量值并量化,用于表示信号强度。量化电平数为2的整数次幂,我们常见的CD位16级的采样大小,即2的4次方。
采样率和采样大小的值越大,记录的波形更接近原始信号,但占用更多的存储空间。
AAC高级音频编码技术
高级音频编码(Advanced Audio Coding),出现于1997年,基于MPEG-2的音频编码技术。由Fraunhofer IIS、杜比实验室、AT&T、Sony等公司共同开发,目的是取代MP3格式。2000年,MPEG-4标准出现后,AAC重新集成了其特性,加入了SBR技术和PS技术,为了区别于传统的MPEG-2 AAC又称为MPEG-4 AAC
AAC压缩比通常为18:1
发展
- MPEG-2 AAC Low Complexity (LC) profile (multichannel)
- MPEG-4 HE-AAC v1 (multichannel) with AAC-LC core
- MPEG-4 HE-AAC v2 (stereo) with AAC-LC core