- 1、本文档共81页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
摘要
随着互联网的迅速发展,网络平台已成为人们获取信息和表达观点的主要途
径,而网络信息繁杂,真假难辨,且传播速度极快,如果不及时对网络舆情做出干
预而是任由其发展,很可能造成严重的后果。对于旅游行业来说,旅游舆情的发展
态势对景区的发展具有深远影响,甚至可能造成严重的经济损失。因此,准确把握
舆情走向,正确引导舆论趋势对景区来说至关重要。鉴于当前舆情环境的复杂性和
传统人工监测方式存在的低效问题,本文提出区域旅游舆情监测平台以解决上述
问题,该平台旨在提供信息化监测手段以实现对旅游舆情的实时监测与分析,为景
区运营管理提供有力的决策支持。本文的主要工作如下:
首先,本文以景点名称为爬取关键词对来自不同平台的旅游舆情数据进行收
集,对数据集进行情感分类标注,并采用了多种方法如去重、清洗、分词、去停用
词等对数据进行预处理。针对离线数据和实时数据设计了不同的导入和存储策略,
通过ETL和分布式存储技术对离线数据进行一致性存储,针对实时数据,平台基
于Kafka消息队列和Doris进行消息分发与持久化存储,以确保数据的实时性和准
确性。
其次,本文建立了舆情情感分析模型,鉴于旅游舆情文本常见的一词多义现象,
单纯判断词汇难以捕捉到文本的情感倾向,必须通过联系上下文信息才能进行分
析,因此本文采用基于BERT的情感分析模型实现文本分析。作为预训练模型,
BERT具有强大的语义理解能力和学习能力,在处理情感分析任务时有着十分卓越
的性能。为进一步验证模型的准确性,本文还设置了实验,基于多个数据集对模型
进行训练和测试,结果表明该模型在文本情感分类方面表现出色。
最后,本文对区域旅游舆情监测平台应具有的功能性和非功能性需求进行了
详细分析,据此设计了平台的系统架构和总体流程,并细化了各个模块的详细设计。
在开发过程中,采用多种开发技术,确保了区域旅游舆情监测平台的顺利实现,以
可视化图表形式将数据直观地呈现给用户。此外还设置了多种功能,提高了用户的
体验性。
关键词:舆情监测,情感分析,BERT,自然语言处理,可视化
ABSTRACT
WiththerapidgrowthoftheInternet,thenetworkplatformhasemergedasthe
primarymeansforindividualstoacquireinformationandarticulatetheirviewpoints.
Nevertheless,thecomplexityofnetworkinformation,thechallengeofdiscerningtruth,
andtheexceptionalspeedoftransmissionposesignificantchallengesandproblems.If
unchecked,thenetworkpublicopinioncouldswiftlysnowballintoseriousconsequences.
Especiallyinthetourismindustry,theevolvinglandscapeoftourismpublicopinion
significantlyinfluencesthedevelopmentofscenicspots,potentiallyleadingtosubstantial
economiclosses.Therefore,itisimperativeforscenicspotstopreciselygraspthepulse
ofpublicopinionandsteeritappropriately.Giventheintricatenatureofthecurrentpublic
opinionenvironmentandthelimitationsoftraditionalmanualmonitoringtechniques,this
thesisproposesaregionaltourismpu
文档评论(0)