基于神经网络集成的WEB文档分类研究.pdfVIP

基于神经网络集成的WEB文档分类研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于神经网络集成的WEB文档分类研究.pdf

LIBRARYANDINFORMATIONSERVICE 基于神经网络集成的 文档分类研究冰 周朴雄 华南理工大学电子商务学院 广州510006 (摘要]将神经网络集成思想引入web文本分类领域,构造一个用于web文本分类的多BP神经网络集成模型;详述模型的设计 思路与结构框架,并分别在公有的英文数据集、实际的中文数据集上进行分类实验;与经典的sⅥ订模型、KNN模型相比,神 经网络集成模型具有更高的分类精度,且对于训练样本集规模具有更好的鲁棒性,不失为一种高效的文本分类新方法,研究其 在文本分类领域的应用将是一个有前景的方向。 [关键词]文本分类神经网络集成精度 [分类号]TP39l A ofWebD唧m饥tCla鳓c鲥onBased伽Neural№细orkE聃哪bI姻 Study Zhou Puxiong ChiIla 510006 ofE—bus硫ss,South College Ubivers时ofrI馘mmo跏Guangzhou ide嬲ofn即mlne铆ork cons廿1lctsamulti—BPn朗ralnetworkens锄bles fbrthewcb [Abs衄In)Insp砌byⅡle en∞mbles,me那thor modeung docum∞t elabomtcsttle memods粕dthefhmeworkOfmodel.The resultsbasedtheChinese扭d classification,锄d design exp鲥胁ental Enghsh databasesdemons仃atethatmemodclwhichtlle卸thoroutholdsthebetter rObusttothescaleof th趾tlleSVM points accur∞y粕d theⅡ枷ng∞t andⅪ州models.舡a∞vel柚de觚tive a filedto∞∞arch of∞uralne咐ork印跎mMesin山edoc岫肋t method,“is tt嵋apphcalions p砌田ising classification. cl懿sificalionneⅢmnet、】l,ork朗sembks [Keywords]document accur∞y 本分类领域,给出了一个适用于w曲文档分类的神经网络集 1引言 成构造方法,取得r满意的效果。 目前,随着hlt咖et的日益发展和网上各类信息的迅猛增2基于神经网络集成的Web文档分类 长,用户对散布在网络各处的文档检索工作变得愈加困难,这就 对web文档分类系统的研究与实现提出了更高的要求。w曲 2.1 Web文本表示 文本自动分类通常指将一篇文章指定至一个或几个预定义的 对web文本分类的第一步是如何在计算机中表示一个该 文本类别中。目前web文档分类已经成为一个研究热点,学 文本。与一般数据库中的结构化数据相比,网页形式文本使用 界也已提出了一系列的分类方法。较为著名的文档分类方法 f与然语言,没有标准结构,计算机难以直接处理。因此首先要对 有支持向量(SVM)¨l、K近邻算法KNN)嘲,神经网络【21、线web文本进行预处理,抽取代表其本质特征的元数据(又称特征 性最小二乘估计(u5F)、贝叶斯算法(Bayes)和决策树等。项),以结构化形式保存,这就是web文本表示,也称目标表示。 net、】I,o呔 自从Han舱n和sal锄on提出神经网络集成(neural目前在信息处理方面,文本的表示主要采用向

文档评论(0)

lizhencai0920 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:6100124015000001

1亿VIP精品文档

相关文档