面向新闻文本的读者情绪预测方法研究-计算机科学与技术专业毕业论文.docxVIP

  • 1
  • 0
  • 约6万字
  • 约 59页
  • 2019-05-11 发布于上海
  • 举报

面向新闻文本的读者情绪预测方法研究-计算机科学与技术专业毕业论文.docx

万方数据 万方数据 Classified Index: TP391.3 U.D.C: 621.3 Dissertation for the Master Degree in Engineering RESEARCH ON READER’S EMOTION PREDICTION TOWARDS NEWS TEXT Candidate: Chengtian Zou Supervisor: Associate Prof. RuiFeng Xu Academic Degree Applied for: Master of Engineering Speciality: Computer Science and Technology Affiliation: Shenzhen Graduate School Date of Defence: December, 2013 Degree-Conferring-Institution: Harbin Institute of Technology 哈尔滨工业大学硕士学位论文 哈尔滨工业大学硕士学位论文 摘 要 随着互联网的发展,各类媒体的形式与内容也得到了各种相应的创新,其 重点之一在于能够更好更多的让用户参与其中以及分享个人感受体验,从而使 得对大规模读者群的情绪分析与跟踪成为可能。通过对用户针对媒体内容产生 的情绪进行分析与预测,不仅可以用于提升用户的搜索、阅读体验,同时在舆 情监控等领域也有着更为广泛的应用。 目前对于文本情绪计算的研究主要集中在对文本本身所表达的情绪进行分 析,而对于读者情绪,即文本所引发的读者情绪的研究,总体上仍处在比较初 级的阶段。本课题研究对读者阅读新闻媒体后的情绪反应进行预测的方法。也 就是给定文本形式的新闻媒体报道,通过对其内容进行自动化的分析从而预测 读者对该新闻事件的产生的情绪类别情况。本文的主要工作包括:第一,研究 了利用新闻标题的语义特征进行读者情绪预测的方法。针对新闻标题文本较短、 词数较少但种类较多、数据稀疏的特点,提出了一种结合多标签分类器和基于 HowNet 语义概念特征的读者情绪预测方法。在此基础上,提出了一种基于语义 概念序列特征的情绪预测方法,通过引入词序特征从而进一步提升了预测性能; 第二,由于目前缺少面向读者情绪认知和预测的词典资源,本文提出并建立了 一种基于情绪表达与情绪认知分离的新型中文情绪词典。在此词典中,将情绪 相关词语按照情绪表达与情绪认知加以区分,在支持传统情绪分析的同时,也 能够支持情绪预测研究;最后,利用已建立的新型情绪词典,本文提出了一种 基于情绪类别强度分布的读者情绪预测方法,分别应用于全文文本与经过扩展 后的标题文本,并最终在标题文本上将此方法与基于新闻标题语义概念的方法 相结合,有效地提高了读者情绪预测的性能。在利用社会化标注建立的读者情 绪语料库上进行的实验中,基于标题语义特征的读者情绪预测方法在降低了特 征维度和运算时间的同时,预测结果的各项性能相对于基线系统有 6.8%以上的 提升;而通过进一步结合人工标注的情绪词典,可以在较低特征维度下即可实 现相对较好的分类效果。实验结果显示,本文提出的基于语义特征和情绪认知 词典的方法可以明显提高读者情绪预测系统的性能。此外,本文实现的新型中 文情绪词典可以广泛用于情绪计算相关领域的研究。 关键词:读者情绪预测;情绪词典;情绪认知; - I - Abstract As the development of the Internet, the innovation on both type and content of various kinds of social media is enhanced. One of the main point is to make the users take their parts in it and share their own experience, which also make the large scale emotion analysis and tracking towards readers possible. The analysis and prediction of reader’s emotion towards media content could be used to improve user’s information retrieval and reading experience, and also have large application on monitoring public opinion and other areas. Currently, the study in the

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档