垃圾评论检测算法的研究-软件工程专业毕业论文.docxVIP

下载本文档

20
0
约5.5万字
约 67页
2019-05-18 发布于上海
举报
版权申诉

垃圾评论检测算法的研究-软件工程专业毕业论文.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

国内图书分类号：TP311 国内图书分类号：TP311 密级：公开国际图书分类号：004 西南交通大学研究生学位论文年姓二零一五年五月一日万方数据一眦Y一一眦Y一一㈣Z一～圳8一一帅帅¨●I一一洲3一一舢2一一㈣8一一㈣4 Classified Index：TP3 ll U．D．C：004 Southwest Jiaotong University Master Degree Thesis Research on Review Spam Detectiocn Algorithm Grade：20 12 Candidate：Zheng Chuan Academic Degee Applied for：Master De铲ee Speciality：Software Engineering Supervisor：Prof．Zhu Yan May 1，201 5 万方数据西南交通大学西南交通大学学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定，同意学校保留并向国家有关部门或机构送交论文的复印件和电子版，允许论文被查阅和借阅。本人授权西南交通大学可以将本论文的全部或部分内容编入有关数据库进行检索，可以采用影印、缩印或扫描等复印手段保存和汇编本学位论文。本学位论文属于 1．保密口，在年解密后适用本授权书； 2．不保密b名用本授权书。 (请在以上方框内打；t妒，) 学位论文作者签名：知，·J 指导老师签名：日期：1D’r军歹园上re 日期：2。廿筝，闷己J、e 万方数据西南交通大学硕士学位论文主要工作(贡献)声明本人在学位论文中所做的主要工作或贡献如下：西南交通大学硕士学位论文主要工作(贡献)声明本人在学位论文中所做的主要工作或贡献如下： 1：本文分析内容型垃圾评论和欺诈型评论的表现形式，并对两种垃圾评论的检测技术手段进行了研究和比较。 2：本文设计了两种内容型垃圾评论检测算法。其中基于BP神经网络的垃圾评论检测算法准确率较高，但是BP神经网络的检测效率较低，不能满足实时检测的需求。在此条件下本文设计了自编码神经网络与朴素贝叶斯相结合的检测模型，在损失较小的检测准确率的情况下，提高了内容型垃圾评论检测的效率，降低了算法对设备的要求。 3：本文通过对欺诈型评论进行研究，设计了基于多元特征的欺诈型评论检测模型。多元特征是指用户行为特征、用户特征和评论内容特征等，其中用户行为特征是欺诈型评论检测的主要特征之一。当前用户行为特征的选择和提取过程掺杂过多的人工参与，主观性较高。本文通过栈式自编码神经网络对用户行为特征进行自动学习，减少特征选择中的人工参与。本人郑重声明：所呈交的学位论文，是在导师指导下独立进行研究工作所得的成果。除文中已经注明引用的内容外，本论文不包含任何其他个人或集体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集体，均已在文中作了明确说明。本人完全了解违反上述声明所引起的一切法律责任将由本人承担。学位论文作者签名：芙哆，，J 日期：1。ly筝j月工r 0 万方数据西南交通大学硕士研究生学位论文西南交通大学硕士研究生学位论文第1页 {两要在电子商务平台上垃圾评论已经严重影响到消费者的用户体验和切身利益，如何检测垃圾评论成为当前研究的热点。垃圾评论可以分为内容型垃圾评论和欺诈型评论，内容型垃圾评论通常为了达到消息传播的目的，欺诈型评论的目的在于改变潜在消费者对商品的印象。本文通过分析垃圾评论的表现形式，分别针对内容型垃圾评论和欺诈型评论进行分析和检测。内容型垃圾评论通常在评论内容中添加广告链接、垃圾网页链接和黄赌毒等，其目的在于信息的推送和病毒的传播等。本文通过研究内容型垃圾评论的表现形式，分析内容型垃圾评论的特征，设计BP神经网络模型和自编码神经网络与朴素贝叶斯的结合模型对内容型垃圾评论进行检测。欺诈型垃圾评论是指评论发布者通过虚假的发货和虚假的订单获取大量的评论权限，蓄意吹捧和诋毁特定对象的形象，达到改变潜在消费者购买行为的虚假评论。欺诈型评论直接影响到消费者的购买决定，损害消费者对商品的知情权。本文通过分析欺诈型评论发布者表现形式，设计了基于多元特征的欺诈型评论检测模型。其中多元特征包含用户行为特征、商品特征、用户自身属性特征和评论内容特征。根据研究表明评论发布者行为特征对欺诈型评论检测贡献较大，然而当前在用户行为特征提取中掺杂过多的人工参与，本文使用栈式自编码神经网络对用户行为特征进行自动学习，减少特征提取中的人工参与，致力于学习更全面的用户行为特征，然后本文使用多元特征对欺诈型评论进行检测。关