- 1、本文档共77页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
from the structure and linguistic phenomenon of Chinese sentences. After constructing a sentimental dictionary automatically using HowNet, a system is implemented for the first Chinese Opinion Analysis Evaluation (COAE 2008). The official evaluation results show its superiority.
In this paper, it proposes a concept of Opinion Important Factor which is composed of Time Important Factor and Source Important Factor. It analyzes formulae of Time Important Factor in the different applications and divides Source Important Factor into two parts, the influence of source and the relatedness of source and domain.
Finally, this paper backs to the applications of space-time elements of opinion. It explores mining methods and evaluation methods for two typical applications whose topics are mining the most popular products in a certain period of time and mining opinion trend respectively.
KEY WORDS: Opinion mining; Space-time elements; Wikipedia; Semantic relatedness; sentimental orientation analysis; Opinion trend
目 录
第 1 章 引言 1
1.1 研究背景及意义 1
1.2 本文的研究内容 2
1.2.1 语义理解 3
1.2.2 中文句子倾向性分析 3
1.2.3 意见时空元素的分析 4
1.2.4 意见时空元素的应用 4
1.3 本文的贡献 4
1.4 本文的组织结构 5
第 2 章 相关研究工作 6
2.1 WIKIPEDIA 相关研究 6
2.2 语义相关度计算 7
2.3 倾向性分析相关研究 7
2.4 主题识别 8
2.5 典型意见挖掘系统 9
2.6 与时间相关的挖掘 9
第 3 章 利用 WIKIPEDIA 理解文本语义 11
3.1 WIKIPEDIA 简介 11
3.2 词典的语义表示 12
3.3 概念词典的作用 12
3.4 语义相关度计算的重要性 13
3.5 WIKIPEDIA 词典的构造方法 14
3.6 语义相关度的计算过程 15
3.7 实验 16
3.7.1 前期处理 16
3.7.2 Wikipedia 类别树 16
3.7.3 概念词典的构造 18
3.7.4 概念词典的定制 18
3.7.5 Wikipedia 词典的构造 19
3.7.6 语义相关度计算实验 19
3.7.7 在主题识别上的应用实验 22
3.8 本章小结 22
第 4 章 细颗粒度中文句子倾向性分析 24
4.1 意见型句子的情感词 24
4.2 中文句子倾向性的语言现象 25
4.2.1 修饰词对情感词极性的影响 25
4.2.2 主题对情感词极性的影响 26
4.2.3 句型对情感词极性的影响 28
4.2.4 关联词对句子极性判断的帮助 28
4.3 情感强度的计算 29
4.4 情感词典的构建 29
4.4.1 词典的分类 29
4.4.2 词的初始极性判别方法 30
4.5 系统实现及评测结果 30
4.5.1 系统主要模块 30
4.5.2 评测结果 32
4.6 本章小结 33
第 5 章 意见时空元素分析 34
5.1 意见模型的扩展 34
5.1.1 主题的模型 34
5.1.2 情感的模型 34
5.1.3 意见的模型 35
5.2 意见重要因子 35
5.3 意见的时间重要因子 36
5.4 意见的来源重要因子 37
5.4.1 来源的影响力
您可能关注的文档
- 国新牌骨痛膏促进家兔骨愈合的实验研究-中西医结合临床专业论文.docx
- 海林市新农村建设发展战略研究-工商管理专业论文.docx
- 管理线损的多代理算法研究-电力系统及其自动化专业论文.docx
- 国网重庆市电力公司基层员工激励机制研究-工商管理专业论文.docx
- 还原型谷胱甘肽对油酸致家兔急性肺损伤的影响及机制研究-呼吸内科专业论文.docx
- 广东移动电子商务建设与运营管理研究-工商管理专业论文.docx
- 光谱法研究四类含氮稠环小分子与牛血清白蛋白的相互作用-化学专业论文.docx
- 国内C2C电子商务网上交易量影响因素分析-管理科学与工程专业论文.docx
- 汉语招呼语及其对外汉语教学分析-汉语国际教育专业论文.docx
- 汉江堤防工程安全评估方法的研究及数据库的设计-水利工程专业论文.docx
- 2024学年第一学期浙江省精诚联盟10月联考高二物理试题含答案及解析.pdf
- 【山东卷】山东省泰安市2024-2025学年高三上学期11月期中考试(11.13-11.15)英语试卷含答案及解析.pdf
- 【浙江卷】浙江省杭州市四校联考2024-2025学年高一上学期10月月考英语试卷含答案及解析.pdf
- 西南大学附中高一10月月考生物试卷含答案及解析.pdf
- 辽宁省县域重点高中协作体2024~2025学年高一上学期10月质量监测试题历史试卷含答案及解析.pdf
- 基于多功能超疏水材料的海水淡化及油水分离研究.pdf
- FKBP5基因多态性与抚养方式对孤儿静息态脑功能的影响.pdf
- 《因明入正理论略抄及后疏》的研习与创作感受.pdf
- HIF-1α、SGK1在子宫内膜增生及子宫内膜癌孕激素抵抗中的表达和意义.pdf
- 初中信息科技大单元教学设计框架构建及应用研究--以《人工智能》大单元为例.pdf
文档评论(0)