- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Web挖掘的敏感信息过滤模型
通信技术前沿技术
C oLmema du innigc a- et idognes TTeecchhnnooll oogg ii ee ss
Web挖掘的敏感信息过滤模型*
段立娟
(北京工业大学计算机学院,北京 100022)
【摘 要】论文分析了敏感信息过滤的重要性和常见的信息过滤手段,提出了一种基于Web挖掘的敏感信息过滤模
型。该模型的主要思想是:采用Web挖掘技术对页面文字与图像内容以及用户访问行为特征进行分析,采用在线与
离线分析相结合、并行处理等技术建立综合过滤体系,为建设文明、健康的网络环境提供技术保障。
【关键词】敏感信息;过滤模型;Web挖掘
【中图分类号】TP391【文献标识码】A 【文章编号】1009-8054(2007) 01-0069-03
Sensitiv e Information Filtering Model Based on Web Mining
Duan Lijuan
(The College of Comp uter Science, Beij ing University of Technology , Beij ing 100022, Ch ina)
【Abstract 】Th is paper describes the importance of sensitive in formation filterin g, introdu ces the typical methods of
information filtering an d proposes a sensitive information filtering model based on web mining. In order to create a h ealth
network environment, some new techniqu es are adopted by the new filter model. First, the text, image content and u ses
accessing features are extracted by using Web mining techniques . Second, some new techniques are adopted to construct
integrated filtering architecture , such as on-line/off-line combination and p arallel processing strategy.
【Keywords 】sensitiv e information; filtering model; Web mining
本文提出基于Web挖掘的敏感信息过滤模型,采用先
1 引言 进的内容分析和使用挖掘技术,在线分析与离线分析相结
近年来,基于内容的信息过滤引起了人们的广泛关注。 合的综合过滤体系,为建设文明、健康的网络环境提供技
[1][2][3][4]
我国很多研究机构开展了此方面的研究 ,一些产品也 术保障。
已出现。现有的内容过滤产品主要有两种表现形式:一种
是专门为客户端开发的过滤程序;另一种是嵌入防火墙的 2 基于Web挖掘的敏感信息过滤模型
过滤模块软件,前一种软件是否能发挥性能和用户是否愿 基于Web挖掘的敏感信息过滤的主要思路是通过采用
意安装和准确配置有很大关系,第二种方式仅能制定一些 数据挖掘技术对网页内容和用户的访问行为进行挖掘,判
简单的过滤策略,否则将产生很大的
文档评论(0)