基于情感分析的在线论坛热点预测.docVIP

  • 4
  • 0
  • 约8.19千字
  • 约 8页
  • 2019-07-29 发布于江西
  • 举报
基于情感分析的在线论坛热点预测 摘要:问题陈述:在线论坛热点预测是一个Web挖掘研究的重要领域,它可以帮助人们在日常生活中做出正确的决定。在线论坛,新闻报道和博客舆论,包含大量的公众意见信息。网络的迅速发展引起了公众意见的高度重视,这对于及时分析社会舆论、正确了解他们的意见趋势非常重要。方法:文本挖掘和情感分析是预测网上论坛热点的重要因素。大部分的传统文本挖掘工作集中在静态数据集,而在线热点预测针对Web信息时动态的和及时的。早期的文本信息处理工作的重点是在实际的领域,而不是在意见领域。由于网络民意的半结构化或非结构化的特点,我们介绍传统向量空间模型(VSM)来表示他们,然后用K平均法进行热点探测,接着我们使用J48分类法进行热点预测。结果:实验采用常见的快速挖掘工具,并且与其他方法的性能进行了比较,比如朴素贝叶斯。使用三个指标验证k-均值和J48之间的一致性。他们的准确性,敏感性和特异性。结论:结果表明k-均值和J48相结合有助于识别预测论坛热点,已获得J48提出的聚类与k-均值明显一致性的结果。 关键词:热点,J48,k-均值,情感分析,文本挖掘,向量空间模型(VSM),明显的一致性,热点预测,一致性 简介 意见挖掘是数据挖掘和自然语言处理(NLP)的一个重要分支学科,可以自动提取,分类和理解不同用户的意见。这些技术也有助于提高现有信息资源的价值,当在线时,可以用于新产品和系统集成。 快速发展的网络信息时代,网络数据以指数形式增长。大多数的在线数据是半结构化或非结构化的格式,是难以自动破译的。随着各大论坛各种各样的网络信息的大量增长,客户很难获取对他们有用的信息。因此,在线论坛热点预测已成为Web挖掘中很有前途的研究领域。 在线论坛热点预测的自动化可以在许多方面对客户有益。例如,公司可以收集他们新产品的评论,或者营销部门可以及时了解客户对有关产品和服务的要求。所以,这促进了对热点的检测以及热点论坛的预测(Li and Wu 2010),有用的信息会提供给这些客户,他们会在决策过程中受益。 统计和机器学习有助于处理大量的在线数据 (Thongwan et al., 2011)。一个新兴的技术被称为情感极性的计算也被称为情感分析(Li et al., 2010)也可以在线文本挖掘过程中进行。文本情感的目的是确定个人对某些特定主题的态度。然而,在意见分类中,相关的词语不是很重要。但是,意见的词表明正面或负面的意见是很重要的,例如,伟大的,极好的,惊人的,可怕的,坏的,极坏的。大部分的意见挖掘方法应用于机器学习技术分类的一些形式。 为意见分类定制的算法也已经在发展了,利用意见的单词和短语,加上一些打分函数。在这项研究中,我们检测到热点论坛,通过计算文本情感分析。这种方法量化了可以识别的用户对于任何论坛的热点的关注度。所提出的工作使用了一个集成文本挖掘和情感分析的方法。 文献综述:有关工作的各种流评论挖掘,情感分类,使用机器学习技术预测热点。 意见挖掘:在当今情形下,在线评论挖掘已经成为一个繁荣的领域,它可以为预测未来事件提供坚实的基础。网上的评论(Chaovalit and Zhou, 2005)变得更有用,并且影响向它的潜在消费者提供产品信息。 提出了以WordNet多知识为基础的方法,统计分析和电影知识集成。实验结果表明,在电影评论挖掘和总结方面,该方法很有效。 生成的语义取向标记的列表 (Hu and Liu, 2004)仅含有用来分析的形容词。最后,机器学习是用来描述相互作用的意见结构。 情感分类:网上的文件,可以基于题目,作者,结构和操作系统进行分类。基于情感分类已成为文本挖掘社区的新前沿。 情感分类的任务是确定词、句子或文档的语义取向。最早期的工作把主题词作为处理单元。一个在文档级的自动情感分类已经完成(Pang et al., 2002) ,在这几种机器学习的方法中,从IMDB电影评论分类中提取了常用的文本特征。它已经指出直接营销是一种促使客户通过各种渠道下订单的方法(Sindhwani and Mellville, 2008)。 为了解决这个问题,一是需要有一个准确的客户细分,在这个基础上能很好地理解客户,使产品相关的信息可以提供给不同细分的客户。分析推特(Thelwall et al., 2011)已经洞察出了为某些事产生共鸣的人。发现曾经由于物理和/或时间的限制,那些客户只有一个有限的范围内的产品可以选择,现在面临着信息过载的问题。 一个有效提高客户满意度的方法,帮助客户根据自己的兴趣识别产品。这又要求提供个性化产品推荐(Popescu and Etzioni, 2005; Thelwall et al., 2010).。 潜类模型(LCM)来规避(Hofmann and Puzicha, 1999)上

文档评论(0)

1亿VIP精品文档

相关文档