面向网络评论的产品特征和极性词挖掘研究-计算机软件与理论专业毕业论文.docxVIP

面向网络评论的产品特征和极性词挖掘研究-计算机软件与理论专业毕业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
I I 摘 要 摘 要 随着电子商务的兴起,网络客户评论也必然会成为人们购买产品和商家改进自身服 务的重要参考,但是如何从海量评论中挖掘出有用信息是一项具有挑战性的工作。产品 特征挖掘作为网络评论挖掘的关键技术之一,已成为网络评论挖掘领域的一个重要研究 方向。本文给出了一种面向网络评论的产品特征和极性词挖掘方法,目的在于从大量网 络客户评论中对产品特征和极性词进行自动化地抽取。 本文基于关联规则算法和属性共现度对网络评论中的产品特征进行挖掘,在获取的 产品特征集合的基础上,通过句法分析器来提取极性词。主要工作如下: 在创建关联规则事务文件过程中建立常用产品特征列表,尽可能地减少中文分词工 具对挖掘结果的影响,通过关联规则算法获取名词和名词短语作为候选产品特征集合, 并将互信息引入到候选特征的剪枝中,对互信息的计算公式进行了改进,计算候选特征 与区分符的互信息值,过滤不满足阈值的候选特征;然后通过极性词挖掘非频繁特征对 关联规则算法进行补充,得到更加全面和准确的产品特征。 在挖掘得到的产品特征集合的基础上,利用句法分析器形成句法分析树,提取存在 SBV 依存关系的词对,通过三步剪枝获得最终的极性词集合。 本文从大型中文购物网站上选取评论语料,对提出的产品特征和极性词挖掘方法分 别进行了验证,实验结果证明了本文方法的有效性。 关键词 关联规则 属性共现 互信息 剪枝 句法分析器 II II Abstract Abstract With the development of e-commerce, network reviews will inevitably become an important reference for people to buy products and businesses to improve their service, but how to dig out useful information from the mass reviews is a challenging work. Product features mining as one of the key technologies of network reviews mining has become an important research direction in network reviews mining area. This paper proposees a network reviews-oriented product features and opinion words mining method, the purpose is to extract the product features in a large number of network reviews automatically. This paper mines the product features and opinion words based on association rules algorithm and the degree of property co-occurrence in the network reviews, and on the basis of product feature set extracts the opinion words by the syntactic parser. The main work is as follow: Creating the common product features list in the process of creating association rules transaction file to minimize the impact of the Chinese fragment tool for mining results, extracting the nouns and noun phrases as the product feature set though the association rules algorithm, and introducing the PMI into the candidate features pruning, we improve the PMI formula to calculate the PMI value between the candidate features and specifiers, filtering the candidate features which do not meet the

您可能关注的文档

文档评论(0)

131****9843 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档