- 1、本文档共9页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
2024年大数据专业毕设选题推荐--第1页
2023年大数据专业毕设选题推荐
选题注意事项:
(1)数据是否能够获取
(2)工作量是否满足毕设要求
(3)代码是否通俗易懂,能否在短期内掌握
(4)选题是否具有现实意义
(5)个人电脑硬件是否支持运行大数据项目
大数据毕设项目主要流程:
(1)大数据环境搭建:虚拟机搭建(分布式、伪分布式)、Hadoop、Hbase、
Zookeeper、Hive、Hbase、Kafka、Flume等组件的安装
(2)数据获取与清洗:爬虫、公开渠道获取等
(3)数据分析:选择合适的大数据分析技术
(4)数据挖掘:聚类、预测、推荐等
(5)可视化展示:大屏、导航栏跳转等
一、Hive数据仓库相关选题
Hive数据仓库项目的核心仓库分层:ODS(源数据层)、DWD(数据明细层)、
DWS(数据汇总层)、ADS(数据应用层)
(1)基于hive的民宿价格分析系统
选题意义:在消费升级背景下,消费转型、消费提升成为新的研究热点.当
前,中国旅游市场在加速复兴中,新型优质的中高端旅游产品推动旅游市场的
迅速恢复.近两年民宿标准化文件相继出台,民宿行业对民宿评级工作的有序
开展,使得民宿业进入了转型升级通道,也为民宿的理论研究创造出有利的条
件。利用Hadoop、Hive、MapReduce等技术为用户解决在民宿选择问题,通
过对用户所提供房屋的容纳人数、便利设施、洗手间数量、床的数量、卧室数
量等相关信息,来进行可视化展示,更加详细的面向用户,更加清晰的展示当
前房屋情况,为用户提供最合理的价格方案,该系统的设计目标是为用户提供
2024年大数据专业毕设选题推荐--第1页
2024年大数据专业毕设选题推荐--第2页
可靠的可视化数据分析服务。
创新点:(1)对Hive数据仓库进行分层建设
(2)聚焦热点领域,较强的现实意义
(3)可视化大屏展示
技术路线:
1、数据爬取:基于python爬取去哪网相关民宿信息,并进行数据清洗
2、数据分析:基于Hive数据仓库进行数据存储和分析,分析维度包括:
民宿价格均值、民宿评分排名、各区域民宿数量、民宿简介词云、民宿均价等
3、数据迁移:Sqoop
4、数据可视化:springBoot+echarts+MySQL可视化
(2)基于hive的厨具用品数据分析可视化
选题意义:目前智能手机随处可见,各种年龄段的人群都可以在网络上
随心所欲的购买商品。巨量电商数据的存储及分析成为了人们普遍关注的话题。
在大批量数据的计算场景中,时效性低的离线数据仓库是大多数业务的首要选择。
依托Hadoop大数据平台,基于Hive数据仓库对电商网站中厨具用品销售
数据进行分析。以可视化大屏的形式对分析结果进行可视化展示。首先运用
Python技术爬取京东网站厨具用品销售数据,爬取的数据存储至HDFS文件系
统。基于Hive数据仓库和HiveSQL工具对数据进行分析。运用Sqoop数据迁移
工具,将分析完成的数据迁移至MySQL数据库。最后,以SpringBoot、MyBaties、
Echart等技术构建可视化大屏,将分析结果以可视化图表的形式进行展示。
创新点:(1)对H
文档评论(0)