基干TF―IDF改进聚类算法网络敏感信息挖掘.docVIP

基干TF―IDF改进聚类算法网络敏感信息挖掘.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基干TF―IDF改进聚类算法网络敏感信息挖掘

基于TF―IDF改进聚类算法的网络敏感信息挖掘   摘 要: 网络敏感信息挖掘过程中,敏感信息和正常信息的特征不同,具有较高的遮蔽性。利用传统敏感信息挖掘方法时,固有的敏感信息被遮蔽,无法进行敏感信息的准确挖掘。提出基于TF?IDF改进聚类算法的网络敏感信息挖掘方法,通过TF?IDF方法获取网络敏感信息文本,在网络敏感信息文本中获取有价值的敏感信息特征,采用该信息完成聚类算法,对全部敏感信息特征进行聚类分析,完成网络敏感信息的挖掘。实验结果说明,所提方法进行网络敏感信息挖掘,具有较高的挖掘效率和精度 关键词: TF?IDF; 聚类分析; 网络敏感信息; 信息挖掘 中图分类号: TN911?34; TP33 文献标识码: A 文章编号: 1004?373X(2015)24?0044?03 Objectionable internet information excavation performed by improved clustering algorithm based on TF?IDF MENG Caixia, CHEN Hongyu (Public security technology department, Railway Police College, Zhengzhou 450053, China) Abstract: In the mining process of objectionable Internet information, the sensitive information is different from normal information and has high shadowing property. When the traditional method is taken to excavate the sensitive information, the sensitive information can not be mined accurately because the inherent sensitive information is obscured. The objectionable Internet information excavation algorithm is proposed, in which clustering algorithm is improved on the basis of TF?IDF. It uses TF?IDF algorithm to obtain objectionable Internet informative text, in which valuable features of the sensitive information are got. This information is used to complete the clustering algorithm, and all the sensitive information features are clustered and analyzed, so that the network sensitive information is mined completely. The experimental results show that the proposed method has high efficiency and precision for objectionable network information excavation. Keywords: TF?IDF; clustering analysis; sensitive network information; information mining 0 引 言 随着网络技术的发展以及互联网用户的不断增加,使得互联网成为一种重要的交流渠道,其存储和传输的信息,特别是敏感话题,在很大程度上反映了社会不同领域和人们关注的热点[1?3]。这些敏感信息对大众舆论形成和传播具有重要作用,同时也存在一定的潜在安全威胁。因此,分析如何及时挖掘网络上的敏感信息,并对其采取有效的解决措施,成为相关部门分析的热点方向[4?6] 当前主流的网络中敏感信息挖掘方法主要有基于BP神经网络的网络敏感信息挖掘方法、基于主元分析的网络敏感信息挖掘方法和基于关联规则算法的网络敏感信息挖掘方法。网络敏感信息在挖掘过程中,敏感信息与正常信息的特征不同,具有较高的遮蔽性。而利用上述分析的几种传统网络敏感信息挖掘方法时,存在固有的敏感信息被遮蔽问题,无法对敏感信息进行准确的

文档评论(0)

linsspace + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档