- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
__________________________________________________________________________
基于潜在语义分析的BBS 文档Bayes 鉴别器1
1) 1) 2) 1)
刘昌钰 唐常杰 杜永萍 郭颖
1)(四川大学计算机系,成都,610064)
2)(山西大学计算机系,太原,030006)
摘 要:对电子公告栏(BBS)文档进行鉴别已成为信息安全技术的重要内容之一。本文融合了数据挖
掘技术、数理统计技术和自然语言理解技术,提出了基于潜在语义分析与Bayes 分类的BBS 文档鉴别方
法 ( Bayes Discriminator based on Latent Semantic Analysis, BDLSA).利用自然语言处理技术从训练文档中
抽取典型短语集;通过潜在语义分析进行典型短语同义归约,应用关联规则采掘技术提高典型短语间的
独立性;用Bayes 分类器对BBS 文档进行鉴别。本文还对影响系统的关键参数进行了大量的讨论和测试,
实验表明新提出的方法对于BBS 文档的鉴别是可行而有效的。
关键词:数据挖掘,关联规则,贝叶斯分类,潜在语义分析,BBS。
中图法分类号:TP??
Bayes Discriminator for BBS Documents based on Latent SemanticAnalysis
LIU Changyu1) TANG Changjie 1) DU Yongping2) GUO Ying1)
1) (Department of Computer Science, Sichuan University, Chengdu,610064)
2) (Department of Computer Science, Shanxi University, Taiyuan,030006)
Abstract: With the rapid development of Internet, the abuse and misuse of BBS become a social problem of
information pollution and call on the demand to the discrimination techniques for BBS document. Borrowing the
techniques from data mining, probability-statistics and Natural Language Understanding, this paper proposes a
new discrimination method for BBS document, called Bayes Discrimination based on Latent Semantic Analysis
(BDLSA). The main steps of new method includes (1) Make typical phrase set by extracting the typical sentences
from training documents in preprocessing stage with natural language understanding techniques. (2). Apply
synonymy reduction on typical phrases by Latent Semantic Analysis (3) Discover the association rules between
typical phrases to increase the independency of phrases so that the traditional Bayes discriminator works efficiently.
(4) Discriminate BBS Document by Bayes cla
您可能关注的文档
- 参赛通知-四川少儿艺术网.DOC
- 双机器人松协调焊接过程无碰路径规划.PDF
- 双绞线同轴电缆光纤光缆-计算机理论与软件研究所.PPT
- 双河乡中心小学李晓梅.PPT
- 双鱼石区块栖霞组气藏试采地面工程环境影响评价评价公众参与说明.PDF
- 参展厂商摊位日本厂商民俗技艺助兴迎接贵宾报到自来水公司董事长.PPT
- 反相高效液相色谱法测定四逆散抗抑郁有效部位中-中国科技论文在线.PDF
- 发热特点-考研云分享.PDF
- 发展现代物流的战略意义-热门行业的项目商业计划书.DOC
- 受美国FDA管辖案件确认事项表.DOC
- 基于科研协同关系的模块化协同分工体系构建研究-图书情报知识.PDF
- 基于粗糙集和多系统的知识挖掘.PDF
- 基于系统效能的大型机电工程项目质量索赔定量研究-Journalof.PDF
- 基于短路发电机系统的MMC型电压源换流器短路电流试验-高压电器.PDF
- 基于组合算法的嵌入式系统软硬件划分方法-计算机应用与软件.PDF
- 基于统计GIS的统计数据分析与辅助决策研究-湖南统计局.DOC
- 基于覆写验证的云数据确定性删除方案Clouddataassureddeletion.PDF
- 基于观察者模式的气象卫星数据接收与预处理调度机制-电子测量技术.PDF
- 基于视觉内容分析和遗传算法优化的鲁棒图像水印算法-包装工程.PDF
- 基于超网络的城乡物流配送网络优化研究-计算机工程与应用.PDF
最近下载
- 《食品经营许可证》延续申请表.doc VIP
- 产教融合视角下的应用型高校微专业建设的探索与实践.docx VIP
- 【宏观专题】牛市进程:十大观察指标-250901-华创证券.pdf VIP
- IBM-中外运产品创新咨询项目IPD体系沟通材料_v1.0_20200228.pptx VIP
- 课件智慧管廊解决方案.pptx VIP
- 2024秋新人教版英语七年级上册课件 Starter Unit 2 Keep Tidy! Section B.pptx
- 油菜高产高效栽培技术详解演示文稿.ppt VIP
- 施工现场安全管理考核明细及罚款金额.doc
- 第5课 罗马城邦和罗马帝国 课件(共23张PPT).pptx VIP
- 血栓相关课件.pptx
文档评论(0)