面向图书评论的观点分析-计算机软件与理论专业毕业论文.docx

面向图书评论的观点分析-计算机软件与理论专业毕业论文.docx

  1. 1、本文档共53页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
摘 要 摘 要 随着网络和计算机在人们生活中的普及,消费者在网上购物后会通过网络发表自己 对产品的评论。由于这些评论包含了消费者对产品的评价意见,因此对其进行挖掘对商 家改进产品以及消费者购买产品起到了辅助作用,有着广泛的应用价值和研究价值。 产品评论挖掘主要包括产品特征抽取、观点抽取以及极性分类等方面的研究。而在 这些研究中,以往的方法将研究重点集中在评论内容上,同时所依赖的极性词典也是由 固定词构成的,因而影响了评论挖掘的效果。针对这些问题,本文面向图书评论进行了 研究,主要工作包括以下几个方面: 在构建词典时,考虑到词对类别的贡献不同,将CHI值思想应用到词典构建中,提 出了一种基于改进CHI值的极性词典构建方法。该方法通过计算每个词的CHI值来完成 对词的极性分类。随后,对于没有包含在词典中的词,根据同类极性词共现的特点对其 进行提取并将满足阈值要求的添加到相应的极性词典中,实现了词典的动态添加,在一 定程度上解决了词典固定不变的问题。另外,考虑到有些极性词是特定修饰某一特征的, 因此又将极性词做了进一步地划分,以便用于分析未包含特征的评论。 在进行评论极性分析时,改进了转折复句的极性计算公式,以适用于图书评论。同 时,考虑到某些图书评论带有标题,而这些标题通常表达了评论者的观点倾向,据此提 出了基于标题和改进的重转句极性计算公式的评论极性分析方法。该方法将标题极性作 为评论的极性标注来对其进行极性分析,并在分析中利用上述改进的公式调整评论极 性,从而减少了评论极性分析的错误。 在进行评论观点总结时,改进了SBV算法,以适用于图书评论。该方法主要根据词 语间的依存关系来提取评论句中的特征和观点,据此对评论进行观点总结。 实验结果表明,本文提出的方法是有效的,较好地改善了图书评论观点分析的效果。 关键词 动态词典 标题极性 极性分析 依存关系 重转句 I Abstract Abstract With the increasing popularity of network and computers, customers can express their reviews after shopping online. As these reviews contains consumers’attitudes of products. So, mining product reviews plays a supporting role at improving the product for trade companies and purcharing the product for consumers, which is valuable in application and research. Product reviews mining includes the research of features identification, opinion words extraction and polarity classification. In these researches, previous methods all focused on the content of reviews, and the polarity dictionary constructed is to be composed of fixed words, which affects the effective of reviews mining. To solve these problems, we devote the research on book reviews. The main tasks of this paper are as follows: Firstly, we consider that the contribution of words to categories is different, so use CHI to construct dictionary and propose a polarity dictionary construction method based on the improved CHI, which classifies words via calculating the CHI of each word. Then, this paper extract the words which are not included in the dictionary according to the characteristics of co-occurrence of si

您可能关注的文档

文档评论(0)

jianzhongdahong + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档