基于书签的校园搜索引擎.pptVIP

  1. 1、本文档共24页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于书签的校园搜索引擎.ppt

LOGO 基于书签的校园搜索引擎 Web 2.0时代的网络收藏夹 国防科技大学信息中心 当前校内资源的特点 随着数字校园的全面推进,大大小小总共千余个应用系统纷纷上线。 越来 越多 想查找一个资源十分困难,比如学籍制度,就必须知道归口部门的网站才能逐级找。 查找 困难 任何一个地址变化,都必须修改校内各大 门户的链接,才能确保正确性。 维护 麻烦 国防科技大学信息中心 黄页式的寻找 国防科技大学信息中心 提出问题 。如何才能不再面临主页上满屏幕的导航而眼花? 。如何在不知道资源所属网站的情况下找到它? 。如何迅速地定位到所需的资源? 。如何将链接管理的任务从管理员交给用户们? 国防科技大学信息中心 搜索引擎的引入 随着网络在教学、科研、管理等多方面应用的开展,信息的查找和定位变得更为困难。为了解决这个问题,目前一般采用和通用搜索引擎类似的方法来进行搜索。但是两者的使用环境和适应情况具有很大的差别,通用搜索引擎并不能够很好地胜任校园应用搜索的任务。 根据部分统计结果,校园网络的数据每年以200%的速度增长,其中80%的数据以文件、邮件、图片等非结构化数据形式存放在网络计算机系统中的各个角落。由此,如何方便、快捷、安全地获取内部网络的信息内容,造就了一个新的应用“校园搜索引擎”。 国防科技大学信息中心 传统搜索引擎的缺陷 不分类型。比如搜索“教务处”,那么不管链接、新闻、文件,只要带有关键词的文本全部都堆砌起来,让用户找去吧! 不分轻重。不区分哪些链接是用户所感兴趣的,往往将无人关心的一些新闻也堆放到关键位置,从中想要找到有用的东西,不亚于从乱石堆里找宝,很辛苦。 搜索深度。搜索引擎往往遍历整个网站,将全部内容搬运到服务器上,虽然全面却深度太深,服务器长期超负荷运作,经常硬盘溢出。 解决:学习Google PageRank,让用户做主 国防科技大学信息中心 通用搜索引擎 校园搜索引擎 搜索范围 整个Internet网络 局限于校园网络内部 搜索对象 网页、图像、mp3等多种类型的文件 内部知识库、帮助文档、源代码信息库、部门门户新闻等,包含网页、公开邮件、DOC文档、PDF文件、图表、报告等 搜索特点 尽量完全性,为用户提供尽可能丰富的搜索结果 专业、定向的搜索,更为注重结果的准确性和高度匹配性。 排序方式 入站链接数量,以及广告费投放数量 用户关心程度 用户参与 参与不多 尽量让用户参与 通用搜索引擎和校园搜索引擎对比 国防科技大学信息中心 通用搜索引擎 校园搜索引擎 异构资源搜索和整合 互联网通信协议。以HTTP为主获取HTML网页和特殊格式文档(DOC、PPT、PDF、MP3、图像等)。 校园内部的各种信息采集接口,包括HTML/XML(HTTP)、RDBMS(API/SQL)、文件系统(NFS/FTP)、Lotus等。 数据的更新 数据更新的周期较长。对静态缓存进行索引,周期性地进行切换和更新。 需要尽量迅速地反映最新的信息更新,动态刷新索引,以保证数据的一致性。 准确性 无法完全包括,相关重要性排序以Page?Rank、Title、Meta为主,面临SEO问题和商业性因素 更为全面,精确计算,字词混合索引,符合元数据查询(结构化),更为准确,受商业化影响较低,排序更合理。 安全性 公开信息,一般不存在安全问题 需要对访问权限进行控制,受限内容不纳入搜索 管理、挖掘和应用 找到信息后即可 需要完备的整合和管理,进行智能的挖掘和分析,面向内部需求提供个性化服务。 国防科技大学信息中心 社会书签的引入 和搜索引擎使用关键词为主的搜索不同,在校园搜索引擎中需要借鉴社会化网络的书签(Tag,又称标签)。 社会书签(Social Bookmark)可以将网站随时加入自己的网络书签中;用多个关键词标示和整理书签,并与人共享;是2004年起Web出现的一种新的内容标引方法。 相对于专业的编目和用户提供元数据的现行方式,社会书签以其方便实用而备受人们的关注和喜爱,被认为是下一代的Web信息基础设施。 国防科技大学信息中心 事物的多面性使Tag必要 某年月日在大围山鹿场拍摄的风景相片,和同事张某一起 某年月日 大围山 梅花鹿 张某 分门别类 准确找到 国防科技大学信息中心 网站同样具有各种相关性 一卡通业务管理系统 (申办、挂失、查询消费、门禁) 图书馆 (借书) 食堂 (吃饭) 信息中心(办卡) 信息化 (数字校园) 广泛联系,只要有用户 认为相关即可找到 但它们在这些Tag中 关联度是不一样的 国防科技大学信息中心 书签和关键词的区别 用户不希望非得记忆系统的网址,而是希望只要用户认为存在相关就应该可以找到。 当然这些书签的关联度是不一样的,也就是说各个系统在书签中的重要程度不一样。 关键词更

您可能关注的文档

文档评论(0)

xx88606 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档