- 1、本文档共27页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PAGE 26
内容摘要
随着社会的发展。抖音短视频APP的碎片化时间娱乐,进行抖音短视频APP的用户数据分析,有利于不同用户的选择以及创作者的内容创作。
针对短视频用户分析是建立在抖音App上的用户评论数据分析,进行抖音用户数据的爬虫,然后进行数据的分析。基于抖音短视频App的用户分析,使用机器学习的情感分析算法进行用户数据的区分以及分析。
在本次研究中,情感分析算法使用贝叶斯模型进行语句的情感分析预测。使用jieba分词系统用于对视频内容进行分类区分。使用机器学习算法中的snownlp库进行中文语句的判断预测,snownlp库可以为中文语句的情绪判断进行预测。当判断返回值越接近1的时候,表示为正面情绪,越接近0的时候表示负面情绪。
在本研究中,采取了百度AI情感分析以及本研究使用的基于贝叶斯模型的snownlp库情感分析的对比数据测试,从数据样本中随机抽取1000条数据进行准确度测试。经过测试分析,本研究使用的情感分析算法与百度AI得出的情感分析的准确率达到85%。通过数据测试,证明本研究所使用的情感分析算法准确率可以得到有效的保证以及可信度。
关键词:数据分析; 机器学习算法; 数据爬虫; 分词
Abstract
With the development of society. The fragmented time entertAInment of Douyin Short Video APP, user data analysis of Douyin Short Video APP is beneficial to the choice of different users and the content creation of creators.
The analysis of short video users is based on the analysis of user comment data on the Douyin App, crawling the user data of Douyin, and then analyzing the data. Based on user analysis of Douyin Short Video App, machine learning sentiment analysis algorithm is used to distinguish and analyze user data.
In this study, the sentiment analysis algorithm uses Bayesian models to predict sentiment analysis of sentences. Use jieba word segmentation system to classify video content. Use the snownlp library in the machine learning algorithm to judge and predict Chinese sentences. The snownlp library can predict the sentiment judgment of Chinese sentences. When it is judged that the return value is closer to 1, it represents positive emotions, and the closer it is to 0, it represents negative emotions.
In this study, BAIdu AI sentiment analysis and the comparative data test based on Bayesian model-based snownlp library sentiment analysis were used, and 1,000 data were randomly selected from the data samples for accuracy testing. After testing and analysis, the sentiment analysis algorithm used in this study and BAIdu AIs sentiment analysis accuracy rate reached 85%. The data test proves that the accuracy of the sentiment analysis algorithm us
文档评论(0)