基于潜在语义分析的BBS文档Bayes鉴别器-中国科技论文在线.PDFVIP

基于潜在语义分析的BBS文档Bayes鉴别器-中国科技论文在线.PDF

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
__________________________________________________________________________ 基于潜在语义分析的BBS 文档Bayes 鉴别器1 1) 1) 2) 1) 刘昌钰 唐常杰 杜永萍 郭颖 1)(四川大学计算机系,成都,610064) 2)(山西大学计算机系,太原,030006) 摘 要:对电子公告栏(BBS)文档进行鉴别已成为信息安全技术的重要内容之一。本文融合了数据挖 掘技术、数理统计技术和自然语言理解技术,提出了基于潜在语义分析与Bayes 分类的BBS 文档鉴别方 法 ( Bayes Discriminator based on Latent Semantic Analysis, BDLSA).利用自然语言处理技术从训练文档中 抽取典型短语集;通过潜在语义分析进行典型短语同义归约,应用关联规则采掘技术提高典型短语间的 独立性;用Bayes 分类器对BBS 文档进行鉴别。本文还对影响系统的关键参数进行了大量的讨论和测试, 实验表明新提出的方法对于BBS 文档的鉴别是可行而有效的。 关键词:数据挖掘,关联规则,贝叶斯分类,潜在语义分析,BBS。 中图法分类号:TP?? Bayes Discriminator for BBS Documents based on Latent SemanticAnalysis LIU Changyu1) TANG Changjie 1) DU Yongping2) GUO Ying1) 1) (Department of Computer Science, Sichuan University, Chengdu,610064) 2) (Department of Computer Science, Shanxi University, Taiyuan,030006) Abstract: With the rapid development of Internet, the abuse and misuse of BBS become a social problem of information pollution and call on the demand to the discrimination techniques for BBS document. Borrowing the techniques from data mining, probability-statistics and Natural Language Understanding, this paper proposes a new discrimination method for BBS document, called Bayes Discrimination based on Latent Semantic Analysis (BDLSA). The main steps of new method includes (1) Make typical phrase set by extracting the typical sentences from training documents in preprocessing stage with natural language understanding techniques. (2). Apply synonymy reduction on typical phrases by Latent Semantic Analysis (3) Discover the association rules between typical phrases to increase the independency of phrases so that the traditional Bayes discriminator works efficiently. (4) Discriminate BBS Document by Bayes cla

文档评论(0)

suijiazhuang1 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档