基于特征选择和特征加权算法的文本分类分析-text classification analysis based on feature selection and feature weighting algorithm.docxVIP
- 14
- 0
- 约4.98万字
- 约 50页
- 2018-05-20 发布于上海
- 举报
基于特征选择和特征加权算法的文本分类分析-text classification analysis based on feature selection and feature weighting algorithm
摘 要随着互联网这一新型的信息传播方式的迅速普及,人们不仅可以轻而易举地获得全世 界你想要的信息,还可以向全世界传递你所拥有的信息,人们在互联网上可获取的信息资 源呈现爆炸式增长。同时,随着平板电脑、智能手机等网络终端的推出,以及各种社交网 络的出现,如人人网、微博、微信、各种招聘网站和各种婚恋网站等等,更大大加快了互 联网上数据信息增加的步伐。人们每天都会在这些应用上不断更新着各种各种的数据,文 字、图片、视频信息等。有数据显示,互联网上每天都会有指数级的信息数据出现,人们 已经处在一个信息极为膨胀的年代。面对这样如此庞大的信息资源,如何对其进行有效合 理的管理,使人们获取目标信息更为方便快捷,已经成为研究的热点。而文本挖掘中的文 本分类技术有效的解决了这一问题。文本分类是一项非常复杂的工程,本文在对其各个流程进行仔细了解分析之后,重点 研究了特征降维和特征加权两方面的过程。经过文本预处理后的文本被表示为一个具有高维度和稀疏性的特征项向量空间,这不 但增加了分类的时间复杂度和空间复杂度而且还大大影响到分类的精度。特征降维可以有 效地解决这一难题,包括特征抽取和特征选择两种。相比较之下,特征选择算法因其过程 比较简单,且可以取得比特征抽取算法更理想的降维效果,在文本分类系统中受到广泛应 用。本文首先简要介绍了几种传统的特征选择算法,其中重点介绍被学者证明特征选择效 果比较好的信息增
您可能关注的文档
- 基于税收遵从理论的税收征管模式完善研究--以d市国税局为例-research on the improvement of tax collection and management model based on tax compliance theory - taking d irs as an example.docx
- 基于税收遵从理论的税收征管模式完善分析--以d市国税局为例-perfect analysis of tax collection model based on tax compliance theory - taking d irs as an example.docx
- 基于税收利益与破产成本的企业投融资决策互动关系分析-analysis of interactive relationship between investment and financing decisions of enterprises based on tax benefits and bankruptcy costs.docx
- 基于顺应理论的英语间接拒绝语分析-an analysis of english indirect refusals based on adaptation theory.docx
- 基于水天线的电子稳像技术分析-analysis of electronic image stabilization technology based on water antenna.docx
- 基于顺应论的中国省 市 自治区网站概况部分的英译分析-english translation analysis of the general situation of websites of provinces, municipalities and autonomous regions in china based on adaptation theory.docx
- 基于顺应论的中国政府白皮书英译分析——以《中国和平发展》为分析个案-an analysis of english translation of chinese government white papers based on adaptation theory —— a case study of china's peaceful development.docx
- 基于顺应论的模糊用语语用功能和口译策略——以杨洁篪外长答记者问为例-pragmatic functions of vague terms and interpretation strategies based on adaptation theory - taking foreign minister yang jiechi's answer to reporters' questions as an example.docx
- 基于瞬时频率和局部窄带信号的自适应分解方法探讨-discussion on adaptive decomposition method based on instantaneous frequency and local narrowband signals.docx
- 基于水平集活动轮廓模型的红外人体目标分割方法分析-analysis of infrared human target segmentation method based on level set active contour model.docx
原创力文档

文档评论(0)