两类仿生学算法在文本分类中应用及研究.pdf

两类仿生学算法在文本分类中应用及研究.pdf

  1. 1、本文档共57页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
优秀硕士毕业论文,完美PDF格式,可在线免费浏览全文和下载,支持复制编辑,可为大学生本专业本院系本科专科大专和研究生学士硕士相关类学生提供毕业论文范文范例指导,也可为要代写发表职称论文提供参考!!!

摘要 摘要 随着信息技术的发展,用户获取到的信息量不断地增加,其中大部分是文本 类型的数据,一种高效地管理并有效地利用这些无序数据的技术一文本挖掘技术 在这几十年来逐渐地成为一个热点研究领域,文本分类是该领域中的一个重要研 究方向。自从90年代以来,文本分类技术中开始引入统计方法和机器学习方法, 以前的基于知识工程的文本自动分类方法逐渐地被取代了,同时也涌现出一大批 对文本分类中各关键技术进行深入细致研究的文献,这些研究主要包括在文本预 处理、特征选择、文本表示模型、分类方法和分类性能评价等方面。在面对互联 网发展带来的海量数据处理的问题时,各种文本处理方法都表现出一定的困难。 如数据量大、建立的向量空间模型的特征项的维数大、预处理和计算时间长、数 据集中噪声多和分类算法的精度低等问题。本文对文本分类中特征选择方法和分 类算法进行了研究。 佳点集遗传算法是利用数论中佳点集的理论对遗传算法中的交叉算子重新 设计,以导向以高适应度模式为祖先的“家族”方向的随机搜索算法,与遗传算 法相比,算法的精度和速度有所提高,避免了早期收敛现象。覆盖算法从几何的 角度出发,把输入的样本向量映射到高维的空间球面上,并通过训练以尽可能少 的领域覆盖各个类别形成分类网络模型。粒子群算法是一种模拟鸟群迁徙的进化 算法,类似于遗传算法,从随机的初始解开始迭代搜索最优解,也用适应度来评价 解的品质,但在迭代过程中没有交叉和变异这两个操作,是一种容易实现,精度高, 收敛速度快的算法。 本文结合佳点集遗传算法在高适应度模式的祖先上搜索更好样本的原则和 K近邻算法的简单有效性,提出了基于佳点集遗传算法的特征选择方法;针对覆 盖算法具有对高维数据的良好处理能力,但存在分类精度和泛化能力之间的矛 盾,本文将覆盖算法和粒子群优化算法相结合,提出一种改进的粒子群优化覆盖 算法。最后本文构建了文本分类系统,通过在三组数据上进行实验对比分析,以 及F1测量对其性能评估,结果表明本文提出的算法可以有效地提高分类精度和 效率。 关键词:佳点集;特征选择; 粒子群优化算法 Abstract 一————————————————————————————————————————————————一 Abstract accessto ofinformation call increasing Withthe technology,users development whichis efficient and of data,all management amountof text-type information,most data-text Bseof in suchdisorder miningtechnology effective technologyprocessing isan research classification becomesahot inthe fewdecades field,text past field.Since90 has

您可能关注的文档

文档评论(0)

wpxuang12 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档