基于简易密写架构的维文反过滤技术研究.pdfVIP

  • 10
  • 0
  • 约9.13千字
  • 约 5页
  • 2017-09-11 发布于内蒙古
  • 举报

基于简易密写架构的维文反过滤技术研究.pdf

2013年第07期 基于简易密写架构的维文 反过滤技术研究 木尼拉 ·塔里甫 ,安尼瓦尔 ·加马力 。,亚森 ·艾则孜 ,帕力旦 ·吐尔逊 (1.新疆财经大学,新疆乌鲁木齐 830012;2.新疆警察学院,新疆乌鲁木齐830011; 3.新疆大学,新疆乌鲁木齐830046) 摘 要 :目前 web内容的过滤和审计注重从Web元素中删除噪音 (如作为HTML、XML等文档结 构元素的标签)后 ,对纯web文本 中的明显的关键词 /敏感词或 URL地址进行过滤。忽略 了除了文本 以外的网页元素 (如颜色、字体、表格、框架、图片、音视频等 )和基于语言特征的隐藏信息的发现和过滤。 利用这些元素和维吾尔文特征则正好可以用来隐藏关键词 /敏感词或 URL信息,从而躲避信息的过滤。 利用维吾尔文词语间隔、段落间隔空间和像逗号、句号等标点符号混合使用的方法可以实现在 Web文 本 中嵌入敏感词语和 URL信息并

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档