1 技术原理及实现方案
IP 网上的通信语音多采用高效压缩算法,例如G.711,G.723,G.726,G.729 等,语音流速率太高对网络带宽要求太高,所以多采用低比特率的压缩语音流。本系统选择8 Kb/s 的G.729 语音压缩算法对载体语音压缩,在压缩数据流中嵌入秘密信息。含密语音流保持8 Kb/s 的速率不变,使得系统不仅在高速的局域网,Internet 网和军事信息网上运行,也能够在中低速的IP网上运行,比如手机无线数据网、军事野战网等环境。
1.1 G.729语音压缩算法
G.729是ITU.T于1996年公布的8 Kb/s语音编码方案,它使用了当今语音压缩编码的各种先进技术,达到了长途电话音质,已广泛地应用于个人通信和卫星系统中。被8 kHz采样,量化成16 b线性PCM数字信号输入到编码器。该编码器是基于线性预测分析合成技术,以尽量减少实际语音与合成语音之间经听觉加权后差分信号的能量为准则来进行编码。
编码器(见图1)对10 ms长的语音帧进行处理,每帧分为两个子帧。每帧进行一次线性预测(LP)分析,并将LPC参数转换到线谱,对LSP形式进行预测式二阶段矢量量化(VQ)。然后使用分析合成法,提取激励参数。激励参数(包括固定码本和自适应码本参数)要每子帧(5 ms)计算一次。每帧要利用感觉加权语音进行一次开环整数基值基音延时估计,然后进行闭环的分数值基音分析,确定自适应码本的延时和增益,下面再进行固定码本的搜索。自适应码本和固定码本的增益使用预测式二阶段共轭结构码本进行矢量量化。参考G.729 音频标准ITU Recommendation G.729,得到编码参数的比特分配见表1.
在G.729 解码器端(见图2),先要从接收到的码流中提取LSP系数和两个分数基音延时、两个固定码本矢量以及两套自适应码本和固定码本增益等参数。然后,对LSP参数进行插值,并转换到线性预测滤波器系数的形式。接下来,将自适应码本和固定码本矢量分别乘以各自的增益再相加,得到激励信号。激励信号通过LPC综合滤波器后,就得到了合成语音信号。最后还要对合成语音信号进行后处理,以提高合成语音的质量。
|