- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种基于字频的文本数字水印算法.pdf
一种基于字频的文本数字水印算法
吴悠黄华军
湖南大学计算机与通信学院,湖南长沙,410082
摘要:针对文本数字水印算法抗攻击性不强,鲁棒性不高的现状,提出了一种新的基于汉字
频率的中文文本数字水印算法。通过对高频字进行分组,将水印序列嵌八文奉中,井利用正弦
函数和CRC纠错码提高了算法的鲁棒性。实验结果表明,该算法实现的水印具有较好的视觉
透明性和一定的应用价值。
关键词:字频;数字水印;正弦函数;CRC
1.引言
文本数字水印,就是以一定的方式对文本内容及格式等进行修改,嵌入所需信息但不
易被察觉。它可以标识和验证出作者、所有者、发行者或授权消费者的信息,还可以追溯
作品的非法分发。目前的研究主要有基于文本格式和基于自然语义两种途径,如
MaxemchukIll等人提出的通过修改文档字间距(或行间距,字符特征)来嵌入水印信息,
这种方法抗攻击性不强,鲁棒性1i高;Purdue大学的Atallah教授等人提出通过构建语义
表达树(TMRtree)来嵌入水印“J,这一方法鲁棒性较好,但由于自然语义的复杂性,实
现起来难度较大,且在中文领域的应用还不够成熟。因此,我们通过对常用汉字的频率统
计分析,提出了一种通过修改文本灰度值在高频字中嵌入水印的中文文本数字水印算法。
实验表明,该算法具有较高的鲁棒性和一定的应用价值。
本文组织结构如下:第2部分介绍字频统计;第3部分对水印算法进行了阐述;第4
部分是实验结果与分析;第5部分是总结。
2.字频统计
字频就是汉字的使用频度,是指在‘定的历史时期内经抽样取得的文字资料里,每一
个汉字的使用次数与抽样资料总字数的比例。这里,我们采用的是清华大学的宁频统计成
果【jJ,如图l:
序号扳字 出现#濑 累计字撤7『分比 幕计万分比
的 29488,a3 291188333111.277 a¨277
2 一 Q7s4M2 3922695112.731 45■.a■
3 固 92153A _8¨艟5 1*.651 56U.660
704
4 在 7■6 55533■1 B2.Ilk5¨2
5 ^ 697930 6251271B-.773 723.kTB
6 T 6_46E6-237 -∞.71s
:言 勰哿 ::裟嚣 嬲嚣 黔搿
9 是 657739 89203#77‘.122 1033.$帖
1_ 正 616/175 9Sk483271.a46 11呐.691
图1汉字频率统计示意图
资助项目 国家自然科学基金资助项目、教育部科研重点项EI/03092)、湖南省杰山中青年基金赞助项目
02JJYB012)
联系作者 吴悠,E—mail:wl com
1282002y@163
376 第一部分第十四届全国多媒体技术学术会议
3.基于汉字频率的文本数字水印算法
3.1水印信号的设计与产生
我们通过为文本的每一个合法使用者分发一个唯一的二进制伪随机序列来确认文本
的授权用户,防止未授权用户对文本的非法使用。用户空间的大小由j进制序列的长度决
定。这里,我们使用32位的伪随机序列,并添加(7,4)CRC循环冗余校验码,形成56位
的二进制水印序列矿。
定义1 CRC循环冗余码是在世位信息码后再拼接R位的校验码,整个编码长度为.Ⅳ
位,因此,这种编码又叫(Ⅳ,固码。对于一个给定的CⅣ。目码,可以证明存在一个最高次
码的生成多项式。
的右边空出的R位即为校验码的位置。用C(x)*2R除以生成多项式G㈤得到的余数就是校
验码。
在接收端收到了CRC码后用G∽去做模2除,若得到余数为0,则码字无误。
您可能关注的文档
最近下载
- 义务教育英语课程标准(2025年版).pptx VIP
- 2023年江苏省宿迁市宿豫区小升初数学试卷.pdf VIP
- (2025年)(职业资格)初级养老护理员模拟考试题库(附答案).docx VIP
- 2025届高考语文复习:《到橘子林去》高考真题说题课件.pptx VIP
- 纪录片创作(第三版).ppt VIP
- 江苏省宿迁市宿豫区2023-2024学年重点中学小升初数学入学考试卷含解析.pdf VIP
- 人教版初中八年级数学下册《第二十章 数据的分析》大单元整体教学设计[2022课标].docx
- 脑电监测在全身麻醉镇静患者临床应用专家共识(2025年版).pptx
- 2025届全国各地高三模拟试题分类精编01集合与常用逻辑用语学生版.pdf VIP
- 2025年成都西川中学语文新初一分班试卷.pdf VIP
文档评论(0)