一种鲁棒音频数字水印时域算法
   来源:现代电子技术     2021年01月17日 21:33

李景丽 高玲

摘 要: 提出了一种强鲁棒性的基于能量差值比较的时域音频数字水印算法。根据要嵌入的水印序列将音频载体分为长度相等的若干节,每节再分为长度相等的若干段,通过比较每节前两段和后两段的能量差值,结合要嵌入的水印序列和人类听觉系统的时域掩蔽效应,采取修改每节前两段或后两段能量差值的方法将水印序列嵌入到音频载体中。实验结果表明,该算法透明性良好,对多种音频攻击均具有良好的鲁棒性,并可实现盲检测。

关键词: 时域算法; 音频数字水印; 能量差值; 掩蔽效应; 盲检测

中图分类号: TN911.7?34; TP309.7 文献标识码: A 文章编号: 1004?373X(2014)11?0085?03

Abstract: A robust time?domain audio digital watermark algorithm based on energy difference comparison is proposed. The audio carrier is divided into several sections with equal length according to the watermark sequence being to be embedded, and each section is divided into several segments with equal length. The watermark sequence is embedded into the audio carrier by comparing and modifying the energy difference of the first two segments and the last two segments of each section, and combinating the time?domain masking effect of human auditory system and the watermark sequence being to be embedded. The simulation results show that the algorithm has good transparency and good robustness against various audio attacks, and can realize blind detection.

Keywords: time?domain algorithm; audio digital watermark; energy difference; masking effect; blind detection

0 引 言

数字水印技术是近年来兴起的前沿研究领域,在多媒体信息的版权保护和完整性认证方面得到迅猛发展,已成为多媒体信息安全研究领域的一个热点[1]。音频数字水印技术就是在原始音频文件中嵌入水印信息的过程,不同应用场合下,水印内容可以是一段文字、一幅图像[2]、一段音频或者视频[3]等。由于人类听觉系统对噪声的存在非常敏感,且现有众多音频处理软件可方便地对音频文件进行多种操作,故通常要求水印信息的嵌入要与人类听觉系统相结合,不能对原始音频文件造成人耳可察觉的失真影响,并能够抵御常见音频攻击,此外,一般还应满足易于提取和能实现盲检测等条件。

根据水印信息的隐藏位置不同,音频数字水印有时域和变换域之分。时域音频水印易于实现且计算复杂度较低[4],但抵抗攻击的能力即鲁棒性较差[5]。变换域音频水印[6?8]通常具有较强的鲁棒性,但在计算复杂度、嵌入和提取速度、实时性等方面不如时域音频水印。本文旨在设计一种强鲁棒性的音频数字水印算法,这在对实时性要求较高的秘密通信领域显得尤为重要。该算法采用分段求取能量差值并进行比较的方式,结合人类听觉系统的时域掩蔽效应实现水印信息的嵌入。实验结果表明,该算法满足对鲁棒性的设计要求,透明性好,并可实现盲检测。

1 水印序列的嵌入

1.1 音频载体的划分

将音频载体信号表示为:

[M={m(i), 1≤i≤L}]

式中:[M]为音频载体信号;[L]为音频载体的长度。

将要嵌入到音频载体中的二值水印序列表示为:

[W={w(i),1≤i≤N}, w(i)∈{0,1}]

式中:[W]为二值水印序列;[N]为水印序列的长度。

将音频载体信号划分为[X]节,每节长度相等。为保证水印序列可被完整的嵌入到音频载体中,需满足条件:[X≥N]。再将每节划分为等长的[Y]段(本算法要求[Y≥4]),每段长度为[S]。分别用[Mx1]和[Mx2]表示第[x]([1≤x≤X])节音频载体信号的前两段,用[Mx3]和[Mx4]表示第[x]节的后两段,则划分后第[x]节的前两段和后两段可分别表示为:

1.3 水印序列的嵌入

在音频载体信号的每一节实现一位水印信息的嵌入。根据对音频载体信号每一节的能量差值[EDx1]和[EDx2]进行比较的结果,结合要嵌入的水印序列和人类听觉系统的时域掩蔽效应,通过修改相应段中音频载体信号取样值的方法实现在时域嵌入水印信息。

1.3.1 水印比特为“1”时的嵌入算法

当要嵌入的水印比特为“1”时,若[EDx1>EDx2,]则对该段音频载体信号的取样值不做改变。

若[EDx1≤EDx2,]则通过修改相应段的取样值使得[EDx1]增大、[EDx2]减小,直到两者之间满足条件[EDx1>EDx2]为止。具体算法如下:

如果[Ex1>Ex2,]表明音频载体信号有减小的趋势,根据人类听觉系统的时域后掩蔽效应,通过修改相应段的取样值以增大[Ex1],同时令[Ex2]保持不变的方法实现增大[EDx1]的目的,则[Ex1]前面的强音能够掩蔽增大[Ex1]对音频载体信号造成的影响。

如果[Ex1≤Ex2,]表明音频载体信号有增大的趋势,根据人类听觉系统的时域前掩蔽效应,通过修改相应段的取样值以增大[Ex2,]同时令[Ex1]保持不变的方法实现增大[EDx1]的目的,则[Ex2]后面的强音能够掩蔽增大[Ex2]对音频载体信号造成的影响。

同理,如果[Ex3>Ex4,]则通过修改相应段的取样值以减小[Ex3,]同时令[Ex4]保持不变以减小[EDx2;]如果[Ex3≤Ex4,]则通过修改相应段的取样值以减小[Ex4,]同时令[Ex3]保持不变以减小[EDx1]。

1.3.2 水印比特为“0”时的嵌入算法

当要嵌入的水印比特为“0”时,若[EDx1≤EDx2,]则对该段音频载体信号的取样值不做改变。

若[EDx1>EDx2,]则通过修改相应段的取样值使得[EDx1]减小、[EDx2]增大,直到两者之间满足条件[EDx1≤EDx2]为止。具体算法如下:

如果[Ex1>Ex2],则采取减小[Ex1]同时让[Ex2]保持不变的方法以减小[EDx1。]

如果[Ex1≤Ex2,]则采取减小[Ex2]同时让[Ex1]保持不变的方法以减小[EDx1。]

如果[Ex3>Ex4],则采取增大[Ex3]同时让[Ex4]保持不变的方法以增大[EDx1]。

如果[Ex3≤Ex4,]则采取增大[Ex4]同时让[Ex3]保持不变的方法以增大[EDx1]。

2 水印序列的提取

采用该算法在音频载体信号中嵌入的水印序列,在提取水印序列时也要首先对含水印的音频信号进行划分,且节与段的划分方式要与嵌入水印时的划分方式一致。然后针对含水印的音频信号分别计算每节前两段的能量差值[ED′x1]和每节后两段的能量差值[ED′x2,]根据各节能量差值[ED′x1]和[ED′x2]的比较结果,即可实现水印序列的提取,具体提取算法如下:若[ED′x1>ED′x2,]则提取水印比特为“1”;若[ED′x1≤ED′x2,]则提取水印比特为“0”。

可见,采用该算法在音频文件中嵌入的水印序列提取非常简单,并且在提取水印序列时不需要原始音频载体信号,可实现音频水印序列的盲提取。

3 实验与结果分析

实验用原始音频样本选用文件大小为861 KB、取样频率为11.025 kHz、位深为16 b、持续时间为40 s的单声道Wave波形文件。嵌入音频样本中的水印选用文件大小为1.15 KB、像素为93×93的BMP格式的单色二值图像。将该水印图像降维处理成一维序列,降维后的水印序列长度为8 469。原始音频样本长度为441 002,根据本算法将音频样本按照每节50个取样点进行划分,每节再划分为25个具有2个取样点的段。采用基于能量差值比较的音频数字水印算法将水印序列嵌入到音频样本中。

3.1 透明性检测[9]

采用本算法嵌入水印前后的音频信号与误差信号的时域波形如图1所示,其中图1(a)所示为原始音频信号时域波形,图1(b)所示为采用本文算法嵌入水印之后的音频信号时域波形。

由图1可见,采用本算法在音频文件中嵌入水印信息,对原始音频文件的改变很小,再结合人类听觉系统的时域前掩蔽效应和时域后掩蔽效应,这种改变是人耳很难感知到的,故嵌入水印对音频数据的品质影响较小,该算法透明性良好。

3.2 鲁棒性检测[10]

通常用归一化相关系数(NC)来计算提取的水印图像与原始水印图像之间的相似性[11]。设[W]为原始水印序列,[W]为提取的水印序列,[N]为水印长度,则归一化相关系数的计算公式为:

[NC=i=1NW(i)W(i)i=1NW(i)2i=1NW(i)2] (11)

为检测该算法的鲁棒性,分别对已嵌入水印的音频文件进行叠加噪声攻击、重采样攻击、音频格式转换攻击、低通滤波攻击等常见的音频攻击测试,攻击后所提取的水印和相应的归一化相关系数(NC)如表1所示。其中,叠加噪声①攻击是对已嵌入水印的音频文件添加1%高斯白噪声;叠加噪声②攻击是添加10%均匀分布白噪声;重采样攻击是对含水印的音频文件由11.025 kHz上采样至22.05 kHz;格式转换①攻击是在保持采样率为11.025 kHz的情况下,将含水印的音频文件由WAV格式转换为MP3格式,再转换为WAV格式;格式转换②攻击为将含水印的音频文件由WAV格式(采样率为11.025 kHz)转换为MP3格式(采样率为22.05 kHz)再转换为WAV格式(采样率为11.025 kHz);低通滤波①攻击为将含水印的音频文件经过通带内允许最大纹波为1 dB的2阶ChebyshelⅠ型低通滤波器;低通滤波②攻击为将含水印的音频信号经过2阶Butterworth低通滤波器。通过在多种典型音频文件攻击下的测试结果可见,该水印能够有效抵御多种攻击,具有较强的鲁棒性。

4 结 语

本文提出了一种强鲁棒性的音频数字水印时域算法,该算法采用分段求取能量差值并进行比较的方法,结合要嵌入的水印序列和人类听觉系统的时域掩蔽效应修改相应段中的取样值,实现在音频载体中嵌入水印信息。通过对含水印的音频信号采取相同的分段求取能量差值并进行比较的方式实现水印信息的盲提取。实验结果表明,该算法透明性良好,且能够有效抵御叠加噪声、重采样、音频格式转换、低通滤波等多种常见的音频攻击,具有较强的鲁棒性。

参考文献

[1] 金聪.数字水印理论与技术[M].北京:清华大学出版社,2008.

[2] 赵波,卞金来,高飞.基于可视密码术的小波域音频数字水印研究[J].现代电子技术,2008,31(11):84?86.

[3] LU Chun?shien, LIAO Hong?yuan Mark, CHEN Liang?hua. Multipurpose audio watermarking [C]// Proceedings of International Conference on Pattern Recognition. Barcelona: [s.n.], 2000, 3: 282?285.

[4] 孙素静,管会生,王妍妍,等.音频水印算法复杂性评估[J].计算机工程与设计, 2008,29(11):2848?2851.

[5] 李伟,袁一群,李小强,等.数字音频水印技术综述[J].通信学报,2005,26(2):100?111.

[6] WANG Hong?xia, FAN Ming?quan. Centroid?based semi?fra?gile audio watermarking in hybrid domain [J]. Science China Information Sciences, 2010, 53(3): 619?633.

[7] CHEN Ning, ZHU Jie. Multipurpose audio watermarking algorithm [J]. Journal of Zhejiang University (Science A: An International Applied Physics & Engineering Journal), 2008, 9(4): 517?523.

[8] CHEN Bao?yuan, ZHU Yi?qiang, TIAN Lei?lei, et al. Robust audio blind watermarking algorithm based on haar transform [J]. Journal of Harbin Institute of Technology, 2013, 20(3): 104?108.

[9] 王让定,柴佩琪.基于听觉模型的自适应音频数字水印盲检算法[J].同济大学学报:自然科学版,2004,32(11):1516?1520.

[10] 冯涛,韩纪庆.基于听觉特性的音频水印能量估计及自适应嵌入算法研究[J].声学学报,2006,31(1):48?54.

[11] 杨义先,钮心忻.数字水印理论与技术[M].北京:高等教育出版社,2006.

水印 音频 文章