求解中文文本信息过滤的自适应遗传算法及收敛性分析.pdfVIP

求解中文文本信息过滤的自适应遗传算法及收敛性分析.pdf

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
求解中文文本信息过滤的自适应遗传算法及收敛性分析.pdf

求解中文文本信息过滤的自适应遗传算法及收敛性分析* 12 21 朱振方 ,刘培玉 1. 山东师范大学信息科学与工程学院,山东 济南 250014 ; 2. 山东省分布式计算机软件新技术重点实验室,山东 济南 250014 摘 要:针对中文文本信息过滤中过滤模板生成过程的非线性问题,借鉴遗传算法可以在全局范围内寻找 最优解的特性,引入遗传算法解决文本分类问题,并应用一种新的基于集合论的方法证明其在理论上的可 行性。在实际应用中,应用遗传算法生成模板进行了文本分类和文本过滤试验,并结合应用实际提出了遗 传算子的自适应策略。理论证明以及实验结果都说明,该方法具有可行性,能够在信息过滤中取得较好的 结果。 关键词:文本过滤;模糊理论;遗传算法;收敛性 Adaptive genetic algorithm Solving the Chinese Text Filtering and its Convergence Analysis ZHU Zhen-fang12, LIU Pei-yu21 1.School of Information Science and Engineering, Shandong Normal University, Ji’Nan 250014, China; 2.Shandong Provincial Key Laboratory for Distributed Computer Software Novel Technology, Ji’Nan 250014, China Abstract: For the nonlinear problem of template generation in Chinese text filtering, genetic algorithm, which could find optimal solutions within the global context, is introduced into solving text classification problem. At the same time, a new approach based on set theory is applied to prove the theoretical feasibility, and in the application an adaptive strategy of genetic operators is proposed. Theoretical proof and experimental results,including text classification and text information filtering using genetic algorithm, show that the method is feasible and could obtain better information filtering results. Keywords: Text filtering; Fuzzy theory; Genetic algorithm; Convergence 文本过滤[1,2,3]是指大量的文本数据流中寻找满足特定用户需求的文本的过程,当前实 现信息过滤的主要方法有合作过滤和内容过滤两类。基于内容的文本信息过滤是目前信息 过滤研究的热点,而基于内容的信息过滤又分为基于统计的过滤方法和基于机器学习的过 滤方法。在基于机器学习的内容过滤方法中,核心部分是过滤模板的构建和更新。 1 相关背景 [4] 遗传算法 作为自上世纪 70 年代产生以来,很多研究机构和研究人员对其进行了广泛 而深入的研究,取得了很多重要的研究成果,并使其应用领域迅速推广到优化、搜索、机器学 习等方面,逐渐发展成为一种通过模拟自然进化过程解决最优化问题的计算模型。 *基金项目:国家自然基金(NO,山东省高新自主创新专项工程(NO.2008ZZ2

文档评论(0)

wuyouwulu + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档