垃圾评论检测算法的研究-软件工程专业毕业论文.docxVIP

垃圾评论检测算法的研究-软件工程专业毕业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
国内图书分类号:TP311 国内图书分类号:TP311 密级:公开 国际图书分类号:004 西南交通大学 研究生学位论文 年 姓 二零一五年五月一日 万方数据 一眦Y一 一眦Y一一㈣Z一~圳8一 一帅帅¨●I一 一洲3一 一舢2一一㈣8一一㈣4 Classified Index:TP3 ll U.D.C:004 Southwest Jiaotong University Master Degree Thesis Research on Review Spam Detectiocn Algorithm Grade:20 12 Candidate:Zheng Chuan Academic Degee Applied for:Master De铲ee Speciality:Software Engineering Supervisor:Prof.Zhu Yan May 1,201 5 万方数据 西南交通大学 西南交通大学 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并 向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授 权西南交通大学可以将本论文的全部或部分内容编入有关数据库进行检索,可以采用 影印、缩印或扫描等复印手段保存和汇编本学位论文。 本学位论文属于 1.保密口,在 年解密后适用本授权书; 2.不保密b名用本授权书。 (请在以上方框内打;t妒,) 学位论文作者签名:知,·J 指导老师签名: 日期:1D’r军歹园上re 日期:2。廿筝,闷己J、e 万方数据 西南交通大学硕士学位论文主要工作(贡献)声明本人在学位论文中所做的主要工作或贡献如下: 西南交通大学硕士学位论文主要工作(贡献)声明 本人在学位论文中所做的主要工作或贡献如下: 1:本文分析内容型垃圾评论和欺诈型评论的表现形式,并对两种垃圾评论的检测 技术手段进行了研究和比较。 2:本文设计了两种内容型垃圾评论检测算法。其中基于BP神经网络的垃圾评论 检测算法准确率较高,但是BP神经网络的检测效率较低,不能满足实时检测的需求。 在此条件下本文设计了自编码神经网络与朴素贝叶斯相结合的检测模型,在损失较小 的检测准确率的情况下,提高了内容型垃圾评论检测的效率,降低了算法对设备的要 求。 3:本文通过对欺诈型评论进行研究,设计了基于多元特征的欺诈型评论检测模型。 多元特征是指用户行为特征、用户特征和评论内容特征等,其中用户行为特征是欺诈 型评论检测的主要特征之一。当前用户行为特征的选择和提取过程掺杂过多的人工参 与,主观性较高。本文通过栈式自编码神经网络对用户行为特征进行自动学习,减少 特征选择中的人工参与。 本人郑重声明:所呈交的学位论文,是在导师指导下独立进行研究工作所得的成 果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰 写过的研究成果。对本文的研究做出贡献的个人和集体,均已在文中作了明确说明。 本人完全了解违反上述声明所引起的一切法律责任将由本人承担。 学位论文作者签名:芙哆 ,,J 日期:1。ly筝j月工r 0 万方数据 西南交通大学硕士研究生学位论文 西南交通大学硕士研究生学位论文 第1页 {两要 在电子商务平台上垃圾评论已经严重影响到消费者的用户体验和切身利益,如何 检测垃圾评论成为当前研究的热点。垃圾评论可以分为内容型垃圾评论和欺诈型评论, 内容型垃圾评论通常为了达到消息传播的目的,欺诈型评论的目的在于改变潜在消费 者对商品的印象。本文通过分析垃圾评论的表现形式,分别针对内容型垃圾评论和欺 诈型评论进行分析和检测。 内容型垃圾评论通常在评论内容中添加广告链接、垃圾网页链接和黄赌毒等,其 目的在于信息的推送和病毒的传播等。本文通过研究内容型垃圾评论的表现形式,分 析内容型垃圾评论的特征,设计BP神经网络模型和自编码神经网络与朴素贝叶斯的结 合模型对内容型垃圾评论进行检测。 欺诈型垃圾评论是指评论发布者通过虚假的发货和虚假的订单获取大量的评论权 限,蓄意吹捧和诋毁特定对象的形象,达到改变潜在消费者购买行为的虚假评论。欺 诈型评论直接影响到消费者的购买决定,损害消费者对商品的知情权。本文通过分析 欺诈型评论发布者表现形式,设计了基于多元特征的欺诈型评论检测模型。其中多元 特征包含用户行为特征、商品特征、用户自身属性特征和评论内容特征。根据研究表 明评论发布者行为特征对欺诈型评论检测贡献较大,然而当前在用户行为特征提取中 掺杂过多的人工参与,本文使用栈式自编码神经网络对用户行为特征进行自动学习, 减少特征提取中的人工参与,致力于学习更全面的用户行为特征,然后本文使用多元 特征对欺诈型评论进行检测。 关

您可能关注的文档

文档评论(0)

131****9843 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档