- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于哔哩哔哩视频网站的热门视频分析
01工作回顾02模型简介0204数据展示可视化展示目录CONTENTS05数据分析06研究意义
工作回顾爬取更多的数据热门视频的标准(播放量、点赞、投币、收藏、转发)无监督学习:聚类监督学习分析热门视频文本型数据:数据清洗、分词、词频统计数值型数据:预处理、排序数据存储:Mongodb存储数据数据获取:Scrapy-redis爬取数据处理环境:SparkHadoop分布式环境
训练数据
数据展示清洗后的数据
模型简介线性分类(处理连续型数据)??
数据结果展示
模型简介SVM分类器?
数据展示
处理
处理后
结果展示
结果展示SVM线性分类热门视频时长统计k-means三标签统计
对比无监督监督K-means++SVM分类器
总结指标技术收获团队协作
THANKYOU
您可能关注的文档
- Hadoop平台(Hadoop概述+HDFS)介绍课件.pdf
- Hadoop平台(YARN+MapReduce)介绍课件.pdf
- Spark系统介绍课件.pdf
- 大数据概述课件.pdf
- 大数据算法课件.pdf
- 大数据应用课件_可自行拓展.pdf
- 分布式数据库Hbase课件.pdf
- 流计算和图计算课件.pdf
- 《大数据架构与设计》实践报告-地震数据分析与预测研究.docx
- 《大数据架构与设计》实践报告-电影信息智能推荐平台的构建.docx
- 《大数据架构与设计》课程报告讲解-基于大数据的股票预测.pptx
- 《大数据架构与设计》课程报告讲解-基于前程无忧网站招聘信息的大数据分析.pptx
- 《大数据架构与设计》课程报告讲解-基于双注意力机制RNN的载客收益预测算法.pptx
- 《大数据架构与设计》课程报告讲解-基于招聘网站的离线统计及实时分析系统.pptx
- 《大数据架构与设计》课程报告讲解-金融贷款中企业多指标信用评估.pptx
- 《大数据架构与设计》课程报告讲解-社交平台谣言检测.pptx
- 《大数据架构与设计》课程报告讲解-体育大数据背景下的NBA球员分析.pptx
- 《大数据架构与设计》课程报告讲解-涡扇剩余使用寿命预测及状态判定.pptx
- 《大数据架构与设计》课程报告讲解-英雄联盟大数据分析.pptx
- 《大数据架构与设计》课程报告讲解-知乎大数据之青年群体择偶观分析.pptx
网络工程师持证人
本人已从事浙江省工程咨询5年,对浙江省内工程信息非常熟悉,可获取新建工程相关联系人、设计院、业主等关键信息。另外从事楼宇自控专业已10年,考取了一建二建等资格证书,有关考试方面的问题(考试心得、方法、学习资料等)都欢饮来咨询交流。
文档评论(0)