网站大量收购独家精品文档,联系QQ:2885784924

web信息资源价及分类的研究.pdf

  1. 1、本文档共66页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
web信息资源价及分类的研究

摘要 随着Web资源的迅速增长,互联网中的信息越来越丰富。Web信 息资源分类的质量将直接关系着现有信息资源能否高效的服务于信息 需求者,所以Web信息资源分类技术的研究具有重要的实用价值。 Web信息资源质量即将成为网络资源泛滥时代热门的话题。本文 为了提升信息资源的预见性,提出一种补偿式资源质量评价方法,对 庞大杂乱的资源进行有机地分析、评价和分离,将资源的质量特征与 特征提取算法、分类算法等进行有机融合,以减少预处理、分类过程 中各种匹配带来的无谓开销,最大限度的提高过程的效率和质量。 为提升特定行业Web信息资源分类的高效性、实用性,本文提出 了一种面向特定行业的分类方法,借助行业知识库对行业术语进行语 义转换,使其与行业主题特征形成映射关联,然后通过训练过程提取 样本信息资源涉及的主题特征,利用互信息评价函数,计算出每个特 征在对应类别下的权重系数,并结合特征分布均衡的情况对互信息计 算方法进行了改进。接着利用VSM的TFIDF权重计算方法,对待分 类信息资源的特征权重进行计算,最终通过特征权重与权重系数的计 算值建立分类判别规则,以实现对行业信息资源类别的判定。本文还 结合KNN进行了对比实验,验证了分类方法的有效性。 最后,本文以改善资源分类机制、提升资源的易获性、准确性为目 的,构建了一种高效、健全的W曲政务信息资源分类系统,以多维索 引目录为主导对分散的资源进行有机地映射、归类和存储。 关键词Web信息资源,质量评价,分类 ABSTRACT information withthe oftheweb web Along rapidgrowth resource,the webinformationresource becomesricherandricher.Theof quality resourcecanserve classificationis determineshowthecurrent directly informationdemanders. efficiently becomethehot inthe Webinformationresourcewillsoon topic quality resource.Inordertoenhancethe eraofthe ofnetwork proliferation ofinformation a resource,this compensated predictability paperproposes stabilizerevaluationmethodsof and quality the thenumerousand of resource resource,andmerges separates

文档评论(0)

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档