《基于机器学习的新闻文本数据分析与可视化研究》25000字.docx

《基于机器学习的新闻文本数据分析与可视化研究》25000字.docx

III

基于机器学习的新闻文本数据分析与可视化研究

摘要

随着Internet的遍及和飞速发展,网络上的各种类型的信息爆炸式增长,数以亿计。新闻是人们了解社会动态、把握社会发展的一种十分重要的媒介,为了从海量的新闻文本信息中快速的筛选出有价值的信息,对文本进行分类是一种很有效的手段。通过文本分类技术可以实现对新闻文本的过滤,并且将收集到的新闻进行分类从而建立一个类别的文章库。同时,用户也可以更加方便的对感兴趣的类别的新闻进行浏览,改善用户的体验。

本次毕业设计通过python网络爬虫技术从人民网上获取各个类别的新闻数据,去除垃圾文本后利用Jieba库完成对原始新闻文本的分词操作,然后利用

文档评论(0)

1亿VIP精品文档

相关文档