- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
万方数据
万方数据
Dissertation Submitted to Hangzhou Dianzi University for the Degree of Master
Box Office Prediction Based on Consumer Intention and Sentiment Analysis
Candidate: Yuan Yuan Supervisor: Prof. Wang Xiaoyun
January,2016
杭州电子科技大学
学位论文原创性声明和使用授权说明
原创性声明
本人郑重声明: 所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得 的成果。除文中已经注明引用的内容外,本论文不含任何其他个人或集体已经发表或撰写过 的作品或成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。
申请学位论文与资料若有不实之处,本人承担一切相关责任。 论文作者签名: 日期: 年 月 日
学位论文使用授权说明
本人完全了解杭州电子科技大学关于保留和使用学位论文的规定,即:研究生在校攻读 学位期间论文工作的知识产权单位属杭州电子科技大学。本人保证毕业离校后,发表论文或 使用论文工作成果时署名单位仍然为杭州电子科技大学。学校有权保留送交论文的复印件, 允许查阅和借阅论文;学校可以公布论文的全部或部分内容,可以允许采用影印、缩印或其 它复制手段保存论文。(保密论文在解密后遵守此规定)
论文作者签名: 日期: 年 月 日
指导教师签名: 日期: 年 月 日
杭州电
杭州电子科技大学硕士学位论文
摘要
微博作为一种新兴的社交媒体,已经积累了大量的用户和影响力。微博不断增加的在线 评论正在极大影响着传统的市场决策,使得文本挖掘成为商业界和学术界共同的热点话题。 用户的每一条评论所汇聚成的集体智慧,不仅含有对某种商品的购买意愿,即消费意图,此 外,微博平台上包含着用户对商品各方面评价的用户评论也影响消费者的购买决策。这些包 含消费意图和情感倾向的数据对科学研究和商业应用有着极高的价值。
本文以微博中电影主创人员的电影评论为研究对象,重点关注评论中的消费意图和情感 信息挖掘,并探讨将这种信息用于票房预测。具体来说本文的工作主要包括以下五个方面:
(1)对消费意图分类进行重定义:在微博评论中即便用户表达出了消费意图,也不一定 代表会有消费行为,因为消费意图正例包括显式消费意图和隐式消费意图。因此,本文将消 费意图正例定义为显示消费意图,即明确表明要进行消费的用户。
(2)对情感分类标准进行重定义:由于正面评论的数量和票房之间没有直接的关系。因 此本文首先假设如果有更多的微博评论是和票房增长相关,则电影的票房会更好。基于这个 假设将经过主客观分类的微博评论分为 3 类:正面评论即消费意图正例;中性评论即对影片、 演员等表达积极情感的评论;负面评论是对剧情、演技等表达负面或者消极的情感。
(3)基于 SVM 的消费意图挖掘:本文提出了基于 SVM 的消费意图分类算法,首先通 过对微博语料的观察,定义消费意图正例的 2 类特征;然后采用人工标注的方式获得消费意
图正例;将定义的 2 类特征用来表示评论文本并训练出消费意图分类模型,并利用该模型对 给定的微博评论进行消费意图分类;最后将分类结果与人工标注的结果对比,准确率高达 73%。
(4)基于 SVM 的情感分类:为了对评论中的信息进行挖掘,本文首先对已有的情感资 源加以概括和总结,使用扩展的点互信息算法(SO-PMI)判断候选词的情感类别,自动获得领 域词典,构建一个面向微博电影评论的情感词典。然后,由于微博表达方式的多元化,首先 对评论文本进行预处理,采用情感词作为特征选择;最后使用 Libsvm 进行情感分类。
(5)将消费意图和情感分析用于票房预测:本文探讨了将消费意图和情感分析应用于票 房预测,并使用线性回归模型和 SVR 分别进行了实验。结果表明,融入了消费意图的模型在 首映周有更好的预测效果,其对首映周的票房解释能力高达 87%。此外,本文提出的模型和 Baseline 实验对比,首映周相对误差绝对值降低了 24 个百分点;总票房的相对误差绝对值降 低了 14 个百分点。
关键词:消费意图,情感分析,票房预测,支持向量机,线性回归模型
I
ABSTRACT
As a new social media, weibo has accumulated a lot of users and influence. The traditional marketing decisions are greatly influenced by the increasing online reviews, making text mining a hot
您可能关注的文档
- 基于异构多核处理器的静态任务调度算法研究-计算机系统结构专业论文.docx
- 基于用户体验的OTT机顶盒可用性研究-新闻与传播专业论文.docx
- 基于支持向量机的煤自燃预测方法研究-应用数学专业论文.docx
- 基于虚拟环境的小学任务型外语教学研究-外国语言学与应用语言学专业论文.docx
- 基于正交试验设计的快速换模研究-机械工程专业论文.docx
- 基于知识转移的客户关系管理研究-企业管理专业论文.docx
- 基于使用可用度的救灾设备备件需求研究-管理科学与工程专业论文.docx
- 基于用户兴趣模型的元搜索结果排序算法研究-计算机技术专业论文.docx
- 基于增强现实技术的生命探测与救援系统关键技术研究-地图学与地理信息系统专业论文.docx
- 基于蚁群算法和元胞自动机的配电网空间负荷预测-电气工程专业论文.docx
原创力文档


文档评论(0)