III
基于机器学习的新闻文本数据分析与可视化研究
摘要
随着Internet的遍及和飞速发展,网络上的各种类型的信息爆炸式增长,数以亿计。新闻是人们了解社会动态、把握社会发展的一种十分重要的媒介,为了从海量的新闻文本信息中快速的筛选出有价值的信息,对文本进行分类是一种很有效的手段。通过文本分类技术可以实现对新闻文本的过滤,并且将收集到的新闻进行分类从而建立一个类别的文章库。同时,用户也可以更加方便的对感兴趣的类别的新闻进行浏览,改善用户的体验。
本次毕业设计通过python网络爬虫技术从人民网上获取各个类别的新闻数据,去除垃圾文本后利用Jieba库完成对原始新闻文本的分词操作,然后利用
您可能关注的文档
- 《12.6m的双圆空心板梁桥结构设计》18000字.docx
- 《AR模型的研究及其应用研究》17000字.doc
- 《CNC自动上下料机械结构设计及仿真研究》20000字.docx
- 《L市净水厂及配套管网工程设计》30000字.doc
- 《Mdl-80d重型履带式钻机设计》17000字.doc
- 《MPACC案例大赛论文:大数据背景下零售业企业基于内部控制的风险管理策略》37000字.docx
- 《T寿险公司拓展养老社区业务竞争战略研究》31000字.docx
- 《掺烧甲醇对柴油机性能的影响试验研究》6800字.doc
- 《车载天线模型设计及仿真研究》12000字.docx
- 《大跨桥上无缝线路设计—主跨112m提篮拱桥》16000字.doc
原创力文档

文档评论(0)