- 1、本文档共46页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
用户评论分析系统研究毕业论文
目 录
1 绪论 - 1 -
1.1 国外评论分析发展状况 - 1 -
1.2 国内评论分析发展状况 - 3 -
1.3 本课题研究的内容和意义 - 5 -
1.3.1 论文的主要内容 - 5 -
1.3.2 课题研究的意义 - 5 -
1.4 本文的组织结构 - 6 -
2 理论综述 - 8 -
2.1 文本挖掘技术 - 8 -
2.1.1 数据预处理技术 - 9 -
2.1.2 挖掘分析技术 - 9 -
2.1.3 可视化技术 - 10 -
2.2 极性词典 - 10 -
2.2.1 静态极性词典 - 11 -
2.2.2 动态极性词典 - 13 -
2.3 语义极性分析与分析的难点 - 14 -
2.4 本章小结 - 14 -
3 评论分析原型系统设计 - 16 -
3.1 总体设计 - 16 -
3.1.1 文本预处理模块 - 17 -
3.1.2 文本倾向性分析模块 - 18 -
3.1.3 统计分析模块 - 18 -
3.2 极性字典设计 - 19 -
3.2.1 初始极性词典的构建 - 19 -
3.2.2 网络极性词典扩充 - 19 -
3.2.3 领域极性词典修正 - 19 -
3.2.4 否定词典和强调词典 - 19 -
3.3 数据库设计 - 20 -
3.4 系统程序设计 - 21 -
3.4.1 预处理模块程序设计 - 21 -
3.4.2 文本倾向性分析模块程序设计 - 22 -
3.4.3 统计分析模块程序设计 - 23 -
3.5 GUI设计 - 24 -
3.5.1 数据字典管理 - 24 -
3.5.2 评论文本管理 - 25 -
3.5.3 评论文本处理 - 25 -
3.5.4 系统设置和帮助系统 - 26 -
3.6 本章小结 - 27 -
4 系统实现及其在开心商城的应用 - 28 -
4.1 关键问题的解决与实现 - 28 -
4.1.1 系统开发、测试环境搭建 - 28 -
4.1.2 J2EE数据访问方法 - 28 -
4.1.3 数据处理函数及其访问接口 - 30 -
4.1.4 系统核心组件应用 - 31 -
4.2 系统测试 - 32 -
4.2.1 测试资料 - 33 -
4.2.2 评论文本倾向性测试 - 33 -
4.3 开心商城介绍 - 34 -
4.4 系统应用及其步骤 - 34 -
4.4.1 开心商城评论分析系统建立步骤 - 34 -
4.4.2 评论分析原型系统应用效果 - 36 -
4.5 本章小结 - 37 -
5 总结与展望 - 38 -
5.1 总结 - 38 -
5.2 展望 - 39 -
致 谢 - 41 -
参考文献 - 42 -
绪论
最近几年,电子商务迅速发展,网上购物已变得不再陌生,越来越多的人足不出户就能买到自己想要的商品。为了更好地服务网上购物的消费者以及增加消费者的购物经验,许多购物网站联合商家为消费者提供了发表评论的平台,这样,就能够给潜在的购买者提供参考,而且也有利于生产商跟踪客户反馈,从而改善新产品的满意度。对于生产商来说,需要获得对产品全面的反馈信息,只靠人工分析少数的评论远远不够。另外,通过统计和分析商品评论,可以知道用户最关注商品的哪个特性,从而有利于对商品的改善。一个能够收集商品评论,并且能有效归纳评论中的品牌,商品特性,以及评价词语的商品评论总结系统,可以有效地为潜在商品用户和商品制造者提供便利。
随着人们对商品评论的重视,商品评论呈指数级增长,并且这些评论出现在各大论坛、电子公告板以及门户网站上。而这些评论从本质上讲是一种文本,对这种评论的分析实际上是对文本的数据挖掘。对于这种半结构或无结构化的数据,用传统方法获取特定内容信息的手段却较弱,导致信息搜寻困难和信息利用率低下。文本表达了大量的、丰富的信息,同时包含了许多未被所有者发现的潜在知识。面对浩瀚的文本资源,传统的文档和文本处理工具已经不能满足用户的需求。于是在人工智能研究领域结合结构化数据库中的数据挖掘技术,提出了一种有效的、可以充分利用这些文本数据的新的信息处理技术——文本挖掘。
评论挖掘是目前数据挖掘、文本挖掘、自然语言处理等领域的热点研究课题之一。在几年的时间中,无论在英文领域还是在中文领域,观点评论挖掘技术都取得了很大的进步。
国外评论分析发展状况
在国外,2002年是评论挖掘开始兴起的一年。在这一年里,首先Peter[1]提出将语义倾向性应用在非监督的评论分类上,并设计了一个简单的算法。该算法目的就是将评论分为两类,推荐(recommended)和不推荐(not recommended)。一段评论将有包含在该评论中的形容词和副词的语义倾向性决定,也就是说,如果一段评论的平均语义倾向性为正,则可以把该评论划分为推
您可能关注的文档
- 热电厂工业初步设计论文.doc
- 热电厂燃煤输送带控制系统论文.doc
- 热动系统的综合研究与分析论文.doc
- 热处理对铝合金轧制板材力学性能论文.doc
- 热电厂锅炉过热蒸汽温度控制设计论文.doc
- 热风炉的研究与应用论文.doc
- 热风炉控制系统研究论文.doc
- 热风炉系统设计论文.doc
- 热量表的设计与实现论文.doc
- 热连轧带钢的新技术的研究及其应用论文.doc
- 2025江浙沪居民睡眠健康小调研报告.pdf
- 毕业论文的开题报告范文.docx
- 团委活动方案(拓展).docx
- 汽车智能驾驶行业深度报告:端到端与AI共振,智驾平权开启新时代.pdf
- 小核酸行业深度:技术平台和适应症不断验证,迎来销售和临床密集兑现期-华福证券-2025.3.31-65页.docx
- 医药生物行业医疗AI专题报告二多组学篇AI技术驱动精准诊断实现重要突破-25031440页.docx
- CXO行业系列报告三寒冬已过行业需求逐步回暖-25031430页.docx
- 全国租赁市场报告2025年3月_可搜索.pdf
- 玩具行业“情绪经济”专题:创新玩法+IP赋能,重新定义玩具-华鑫证券-2025.docx
- 医疗保健行业PCAB抑制剂药物深度报告抑酸药物市场空间广阔PCAB抑制剂大有可为-25.pdf
文档评论(0)