基于大规模文本数据情感挖掘企业舆情研究.docVIP

基于大规模文本数据情感挖掘企业舆情研究.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于大规模文本数据情感挖掘企业舆情研究

基于大规模文本数据情感挖掘企业舆情研究   摘要:[目的/意义]大数据环境下,文本挖掘和情感分析技术在产品、服务等网络点评分析中得到越来越广泛的应用。通过对大规模文本数据情感挖掘,研究影响企业舆情的关键要素。[方法/过程]基于中国大陆292个城市103 878家酒店的2 500多万条网络点评数据,挖掘企业在线舆情,识别影响顾客服务体验的关键内容要素。采用探索性因子分析方法对关键要素进行归类,并通过多元回归分析得出评论内容要素与顾客总体满意度之间的关系。[结果/结论]酒店客房要素和电器要素对酒店业顾客总体满意度影响最大。本研究方法和结论为服务企业营销和管理的大数据商业分析研究提供参考。   关键词:网络点评 文本挖掘 情感分析 企业舆情 商业分析   分类号:C93   引用格式:吴联仁, 李瑾颉, 齐佳音. 基于大规模文本数据情感挖掘的企业舆情研究[J/OL]. 知识管理论坛, 2016, 1(6): 457-463[引用日期]. http:///p/1/79/.   1 引言   在过去的数年中,信息技术在社会、经济、生活等各个领域不断渗透和推陈出新。在移动计算、物联网、云计算等一系列新兴技术的支持下,社交媒体、协同创造、虚拟服务等新型应用模式持续拓展着人类创造和利用信息的范围和形式。基于信息和网络的生产模式创新正在将人类社会带入“第三次工业革命”时代。新兴信息技术与应用模式的涌现,使得全球数据量呈现出前所未有的爆发式增长态势。预计到2020年,全球被创建和被复制的数据总量将达到35ZB。与此同时,数据的多样性、低价值密度、实时性等复杂特征日益显著。冯芷艳等[1]指出大数据背景下,商务管理研究也面临着前所未有的挑战。   大数据时代,随着电子商务网站、社区型网站和第三方评论网站的发展以及在旅游、酒店行业的普及应用,网络上出现了大量的顾客对酒店的点评内容。截至2014年底,从全国各大中文网站能够采集到的酒店顾客点评数量已达到千万级。这些点评内容实际上是顾客在网络环境下对酒店所提供产品与服务的自发的“问卷调查”结果,是顾客在享受酒店产品和服务后对酒店满意度的详细描述。对这些点评进行有效的采集和分析,将能够代替传统的问卷调查评价,并且能够弥补传统问卷样品有限性和问题局限性的不足。   伴随着大数据时代的到来和自然语言处理技术的快速发展,文本挖掘(text mining)方法――对具有丰富语义的文本进行分析从而理解其所包含的内容和意义的过程――逐渐被认为是更可靠和经常使用的研究方法。在管理科?W研究中,文本挖掘方法经常被用来处理网络点评等非结构化数据。如黄敏学等[2]和李杰等[3]采用文本挖掘方法研究了网络环境下的网络口碑或点评。在旅游和酒店业,文本挖掘方法也渐渐开始被应用[4]。目前,大部分的酒店网络点评内容研究主要是对内容特征属性、评论内容分词的统计分析和聚类分析。例如,L. Zhou等[5]对评论提及酒店各要素的数量进行了统计,给出了各要素的占比。Z. Xiang等[6]采用文本分析方法研究顾客体验与顾客满意度间的关系。熊伟[7]对点评中提及酒店各要素的数量进行了统计,并计算了评论在各要素上的评价得分,做了各项服务体验要素与总体评价的相关分析。   随着大数据文本挖掘研究的深入,情感分析(sentiment analysis),又称意见挖掘(opining mining)开始应用到网络点评这种非结构化的自然语言处理中[8]。张紫琼等[9]指出文本情感分析是指通过语义分析技术对文本的主客观性、观点、情绪、极性的挖掘和分析,对文本的情感倾向做出分类判断。E.Cambria[10]表示基础的文本情感分析是对文本情感极性分析和文本情感极性强度分析。杨立公等[11]将情感极性分为两极,即正面(positive)的赞赏和肯定、负面(negative)的批评与否定。也有学者在正面和负面之间加入了中性(neural),如H. Li等[12]首先通过词频分析方法,对评论中各因子出现的频数进行统计,其次采用聚类分析对出现的因子进行聚类,最后是统计了各因子的正面、中性和负面点评的占比。另外一些学者采用情感极性强度分析网络点评,如丁于思等[13]将顾客满意度分为很不满意、不满意、一般、满意和很满意5个等级。情感分析在大数据环境下对企业顾客洞察、市场营销策略和商业模式创新起到了重要作用。如李实等[14]挖掘中文网络客户评论的产品特征及情感倾向。刘羽等[15]在李实等基础上,进行观点挖掘的产品特征提取。   2 数据采集与处理   本研究使用的数据集由北京众荟信息技术有限公司(http:///)数据应用事业部提供。众荟信息是目前国内旅游、酒店行业主要的大数据挖掘与应用服务提供商。数据集包括了2 500多万条网络点评,涉及国内292

文档评论(0)

189****7685 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档