- 1、本文档共30页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第8章 文本水印技术
第8章 文本水印技术 8.1 文本水印介绍 8.2 文本水印的嵌入方法 8.3 文本水印检测和失真补偿 8.4 中文的文本数字水印技术需要研究的几个问题 8.5 小结 8.1 文本水印介绍 数字水印的研究主要集中于图像、 音频、 视频等方面, 对以文本文档为载体的数字水印研究较少, 但文本水印同样具有很重要的价值。 本章我们对文本水印技术作一些简单的介绍。 通过嵌入水印鉴定文档是否被盗版或篡改的技术很早就出现了。 例如以前的绘图师把所绘城市的一条街道加入或删去一点小细节作为水印标记以鉴别自己绘制的地图。 随着计算机、 打印机和扫描仪等设备的应用和普及, 书刊、 杂志、 报纸的网上发行和其他一些专用文档的网上传输已成为现实并继续高速发展。 8.2 文本水印的嵌入方法 8.2.1 行间距编码 行间距编码就是在文本的每一页中, 每间隔一行轮流地嵌入水印信息, 但嵌入信息的行的相邻上下两行位置不动, 作为参照, 需嵌入信息的行根据水印数据的比特流进行轻微的上移和下移。 在移动过的一行中编码一个信息比特, 如果这一行上移, 则编码为“1”, 如果这一行下移, 则编码为“0”。 一般来说, 大部分的文档格式都有一个特点: 一段内的各行的间距是均匀的。 尽管人眼已熟练于区分不均衡的情况, 但是经验告诉我们: 当垂直位移量等于或小于 1/300英寸时人眼将无法辨认。 为了方便准确地提出水印信息, 通常页面上第一行和最后一行都不作为嵌入的行, 对较短的行也不动, 不作编码。 行间距编码提取水印信息可以采用质心检测法, 质心定义为水平轴上一行的中心。 我们用ΔR,+表示移动行和其上一个不动行的质心之间的距离, 用ΔR,-表示移动行和其下一个不动行的质心之间的距离,并用ΔX,+和ΔX,-表示在原来未作修改文档中相应的质心距离。 因此我们可以作如下判断, 如果 则它与上一行的距离被缩小, 即这一行被上移。 这样水印的数据流就随着行间距的改变而被嵌入到文本中, 在此给出一个如图8 - 1所示的实例。 图中第二行文字向下进行了位移, 图中粗黑线表示各行的质心, 为了便于说明, 我们将黑线加粗, 以显示行间距的改变。 图 8 - 1 行间距编码实例 8.2.2 字间距编码 在文档中可以进行字间距编码, 在这种方法中, 水印标记的嵌入是通过将文本某一行中的一个单词进行水平移位。 通常是在编码过程中, 将某一个单词左移或右移, 而与其相邻的单词并不移动, 这些不动的单词作为解码过程中的参考位置。 编码实例如图8 - 2所示。 图 8 - 2 字间距编码实例 8.2.3 特征编码 特征编码通过改变文档中某个字母的某一特殊特征来嵌入标记。 在这种编码中, 水印信息作为可见的噪声(失真)叠加到字母笔划的边缘和文本中图像的边界上, 对噪声图案进行二值编码, 从而达到嵌入水印的目的。 比较典型的方法是设计两种字体, 通过改变字母位图边界上的像素位置, 使两种字体在视觉上看起来几乎一样, 但又可以检测出不同, 就像字符笔划边缘上叠加了微弱的噪声, 由此可以通过它传递水印信息。 8.3 文本水印检测和失真补偿 8.3.1 预处理 在文本水印的嵌入和检测过程中, 要使处理过的行偏移、 字偏移或笔划失真对读者来说是难以识别的, 然而又必须能从拷贝中提取出来, 这就对水印的稳健性提出了很高的要求。 文本文档通常是由一些设备再生的, 打印机、 复印机、 扫描仪等都可以看作是有扰信道, 它们向文本中引入的噪声可以认为主要是椒盐噪声。 8.3.2 水印检测和提取 在行间距编码算法中, 被嵌入水印的行和与它相邻的上下两行都要求有足够的长度, 即不能太短。 对被嵌入的行可以同时进行行间距编码和字间距编码。 通过行间距编码, 使行在它的原来位置上作了轻微的上下偏移(大约在1/150英寸左右), 通过字间距编码, 使特定的词块有轻微的左右偏移。 但是在打印、 拷贝和扫描过程中使这些轻微的偏移叠加了噪声, 去除这些噪声是水印鉴别和提取的关键, 现就对此噪声作进一步的分析。 在通常情况下, 我们假设噪声是均值为0的高斯白噪声, 实际情况亦是如此, 由此我们可以估算文本失真程度并提出相应的补偿失真的方法。 无论是行间距编码还是字间距编码, 其基本的原理模型都是一样的, 如图8 - 3所示。 它分为三个部分, 对行间距编码来说, 中间区域为被改动行, 即在上
文档评论(0)