网络信息重组与知识挖掘教材课程.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
网络信息重组与知识挖掘教材课程.ppt

* * * * * * * * * * * * * * 网络信息重组 与知识挖掘 所谓信息重组,是在根据对源信息所含知识内容进行分析解构的基础上,运用一定的科学方法将源信息或解构所得信素进行重新组合,从而得到新的信息产品,实现信息增值的过程。 信息重组的含义 信息重组的分类 时间跨度大 时间跨度小 空间跨度大 空间跨度小 信息重组的途径 指引库—— 也称为导航库,是指所建立的信息库,从物理上讲并不存储各种实际的信息资源,它存放的是有关主题的数据库或服务器的地址等信息,可指引用户到特定的地址获取所需的信息。 虚拟图书馆—— 虚拟图书馆是一种网络信息利用工具。它针对某一学科或领域的研究者的需要,将互联网上与之有关的各种资源线索,包括与该学科或领域有关的研究机构、实验室、电子书籍、学术期刊、会议论坛、专家学者等的URL,进行系统地收集、核实并加以组织,以网站、网页或数据库形式提供给用户浏览或者检索。 网络知识挖掘 网络知识挖掘—— 挖掘是指从大量的万维网文档集合中发现蕴涵的、未知的、有潜在应用价值的、非平凡的模式。它所处理的对象包括:静态网页(文字、多媒体信息等)、Web数据库、Web页面的内部结构、Web结构、用户使用记录等信息。通过对这些信息的挖掘,可以得到仅通过文字检索所不能得到的信息。 网络知识挖掘的分类 内容挖掘 Web内容挖掘(Web Content Mining,Web CM)是指对Web上大量文档集合的“内容”进行总结、分类、聚类、关联分析以及利用万维网文档进行趋势预测等,是从Web文档内容或其描述中抽取知识的过程。 可分为内容挖掘和多媒体挖掘两部分。 结构挖掘 Web结构挖掘(Web Structure Mining,Web SM)主要是从Web组织结构和链接关系中推导信息、知识。挖掘页面的结构和Web结构,可以用来指导对页面进行分类和聚类,找到权威页面、中心页面,从而提高检索的性能:同时还可以用来指导网页采集工作,提高采集效率。 可分为文档间挖掘和内容结构挖掘。 用户使用记录挖掘 Web用户使用记录挖掘(Web Usage Mining,Web UM) 主要是想从用户的访问日志中抽取感兴趣的模式。分析这些日志数据可以帮助理解用户的行为,从而改进站点的结构或为用户提供个性化的服务。这方面的研究主要有两个方向:一般的用户访问模式跟踪(General Access Pattern Tracking)和个性化的使用记录跟踪(Customized Usage Tracking)。 Web日志分析流程 信息推送技术 信息推送技术(Push技术),即个性化信息服务,是网络信息组织和检索一个非常重要的发展模式。从技术上看,Push技术是一个基于Internet/Intranet网络环境的高度专业化、智能化的网络专题信息服务系统。基于Push技术的系统不仅能够了解、发现用户的兴趣(可能关心的某些主题的信息),还能够主动从网上搜寻信息,经过筛选、分类、排序后,按照每个用户的特定需求,主动推送给用户。 谢谢大家! * * * * * * * * * * * * * * * * * * * * * * * *

文档评论(0)

youngyu0329 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档