数据挖掘中的文本挖掘的分类算法综述.doc

数据挖掘中的文本挖掘的分类算法综述.doc

  1. 1、本文档共40页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据挖掘中的文本挖掘的分类算法综述 摘要 随着Internet上文档信息的迅猛发展,文本分类成为处理和组织大量文档数据的关键技术。本文首先对数据挖掘进行了概述包括数据挖掘的常用方法、功能以及存在的主要问题;其次对数据挖掘领域较为活跃的文本挖掘的历史演化、研究现状、主要内容、相关技术以及热点难点问题进行了探讨;在第三章先分析了文本分类的现状和相关问题,随后详细介绍了常用的文本分类算法,包括KNN文本分类算法、特征选择方法、支持向量机文本分类算法和朴素贝叶斯文本分类算法;;第四章对KNN文本分类算法进行深入的研究,包括基于统计和LSA降维的KNN文本分类算法;第五章对数据挖掘、文本挖掘和文本分类的在信息领域以及商业领域的应用做了详细的预测分析;最后对全文工作进行了总结和展望。 关键词:数据挖掘,文本挖掘,文本分类算法 ABSTRACT With the development of Web 2.0, the number of documents on the Internet increases exponentially. One important research focus on how to deal with these great capacity of online documents. Text classification is one crucial part of information management. In this paper we first introduce the basic information of data mining, including the methods, contents and the main existing problems in data mining fields; then we discussed the text mining, one active field of data mining, to provide a basic foundation for text classification. And several common algorithms are analyzed in Chapter 3. In chapter 4 thorough research of KNN text classification algorithms are illustrated including the statistical and dimension reduction based on LSA and in chapter 5 we make some predictions for data mining, text mining and text classification and finally we conclude our work. KEYWORDS: data mining, text mining, text classification algorithms,KNN 目录 TOC \o "1-3" \h \z \u 摘要 1 ABSTRACT 1 目录 2 第一章 数据挖掘概述 3 1.1 数据挖掘介绍 3 1.2 数据挖掘常用方法 4 1.3 数据挖掘的功能 5 1.4 数据挖掘的主要问题 5 第二章 文本挖掘概述 8 2.1 文本挖掘介绍 8 2.1.1 文本挖掘的历史演化 8 2.1.2文本挖掘的定义 8 2.1.3文本挖掘的研究现状 9 2.2 文本挖掘主要内容 9 2.3 文本挖掘技术 10 2.3.1 数据预处理技术 10 2.3.2 数据挖掘分析技术 11 2.4 文本挖掘热点难点问题 12 第三章 文本分类算法 14 3.1 文本分类概述 14 3.1.1 文本分类的研究现状 14 3.1.2 文本分类模型 15 3.1.3 文本分类面临的挑战 17 3.1.4 文本分类亟需解决的问题 18 3.2 常用文本分类算法 18 3.2.1 文本分类中的特征选择方法 19 3.3.2 支持向量机文本分类算法 22 3.3.3 朴素贝叶斯文本分类算法 23 第四章 KNN文本分类算法研究 27 4.1 KNN文本分类算法介绍 27 4.2 基于统计的KNN文本分类算法研究 27 4.3 基于LSA降维的KNN文本分类算法研究 30 4.4 其他改进的KNN文本分类算法 31 第五章 文本挖掘应用 34

文档评论(0)

smashing + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档