- 1、本文档共24页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于书签的校园搜索引擎.ppt
LOGO 基于书签的校园搜索引擎 Web 2.0时代的网络收藏夹 国防科技大学信息中心 当前校内资源的特点 随着数字校园的全面推进,大大小小总共千余个应用系统纷纷上线。 越来 越多 想查找一个资源十分困难,比如学籍制度,就必须知道归口部门的网站才能逐级找。 查找 困难 任何一个地址变化,都必须修改校内各大 门户的链接,才能确保正确性。 维护 麻烦 国防科技大学信息中心 黄页式的寻找 国防科技大学信息中心 提出问题 。如何才能不再面临主页上满屏幕的导航而眼花? 。如何在不知道资源所属网站的情况下找到它? 。如何迅速地定位到所需的资源? 。如何将链接管理的任务从管理员交给用户们? 国防科技大学信息中心 搜索引擎的引入 随着网络在教学、科研、管理等多方面应用的开展,信息的查找和定位变得更为困难。为了解决这个问题,目前一般采用和通用搜索引擎类似的方法来进行搜索。但是两者的使用环境和适应情况具有很大的差别,通用搜索引擎并不能够很好地胜任校园应用搜索的任务。 根据部分统计结果,校园网络的数据每年以200%的速度增长,其中80%的数据以文件、邮件、图片等非结构化数据形式存放在网络计算机系统中的各个角落。由此,如何方便、快捷、安全地获取内部网络的信息内容,造就了一个新的应用“校园搜索引擎”。 国防科技大学信息中心 传统搜索引擎的缺陷 不分类型。比如搜索“教务处”,那么不管链接、新闻、文件,只要带有关键词的文本全部都堆砌起来,让用户找去吧! 不分轻重。不区分哪些链接是用户所感兴趣的,往往将无人关心的一些新闻也堆放到关键位置,从中想要找到有用的东西,不亚于从乱石堆里找宝,很辛苦。 搜索深度。搜索引擎往往遍历整个网站,将全部内容搬运到服务器上,虽然全面却深度太深,服务器长期超负荷运作,经常硬盘溢出。 解决:学习Google PageRank,让用户做主 国防科技大学信息中心 通用搜索引擎 校园搜索引擎 搜索范围 整个Internet网络 局限于校园网络内部 搜索对象 网页、图像、mp3等多种类型的文件 内部知识库、帮助文档、源代码信息库、部门门户新闻等,包含网页、公开邮件、DOC文档、PDF文件、图表、报告等 搜索特点 尽量完全性,为用户提供尽可能丰富的搜索结果 专业、定向的搜索,更为注重结果的准确性和高度匹配性。 排序方式 入站链接数量,以及广告费投放数量 用户关心程度 用户参与 参与不多 尽量让用户参与 通用搜索引擎和校园搜索引擎对比 国防科技大学信息中心 通用搜索引擎 校园搜索引擎 异构资源搜索和整合 互联网通信协议。以HTTP为主获取HTML网页和特殊格式文档(DOC、PPT、PDF、MP3、图像等)。 校园内部的各种信息采集接口,包括HTML/XML(HTTP)、RDBMS(API/SQL)、文件系统(NFS/FTP)、Lotus等。 数据的更新 数据更新的周期较长。对静态缓存进行索引,周期性地进行切换和更新。 需要尽量迅速地反映最新的信息更新,动态刷新索引,以保证数据的一致性。 准确性 无法完全包括,相关重要性排序以Page?Rank、Title、Meta为主,面临SEO问题和商业性因素 更为全面,精确计算,字词混合索引,符合元数据查询(结构化),更为准确,受商业化影响较低,排序更合理。 安全性 公开信息,一般不存在安全问题 需要对访问权限进行控制,受限内容不纳入搜索 管理、挖掘和应用 找到信息后即可 需要完备的整合和管理,进行智能的挖掘和分析,面向内部需求提供个性化服务。 国防科技大学信息中心 社会书签的引入 和搜索引擎使用关键词为主的搜索不同,在校园搜索引擎中需要借鉴社会化网络的书签(Tag,又称标签)。 社会书签(Social Bookmark)可以将网站随时加入自己的网络书签中;用多个关键词标示和整理书签,并与人共享;是2004年起Web出现的一种新的内容标引方法。 相对于专业的编目和用户提供元数据的现行方式,社会书签以其方便实用而备受人们的关注和喜爱,被认为是下一代的Web信息基础设施。 国防科技大学信息中心 事物的多面性使Tag必要 某年月日在大围山鹿场拍摄的风景相片,和同事张某一起 某年月日 大围山 梅花鹿 张某 分门别类 准确找到 国防科技大学信息中心 网站同样具有各种相关性 一卡通业务管理系统 (申办、挂失、查询消费、门禁) 图书馆 (借书) 食堂 (吃饭) 信息中心(办卡) 信息化 (数字校园) 广泛联系,只要有用户 认为相关即可找到 但它们在这些Tag中 关联度是不一样的 国防科技大学信息中心 书签和关键词的区别 用户不希望非得记忆系统的网址,而是希望只要用户认为存在相关就应该可以找到。 当然这些书签的关联度是不一样的,也就是说各个系统在书签中的重要程度不一样。 关键词更
您可能关注的文档
- 四季豆 茄子 丝瓜 番茄 大葱 栽培技术.doc
- 四川文理学院学生工作部(处) 2009年11月3日.doc
- 四川省2013年413公务员.doc
- 四川省泸州市高级教育培训学校2013届高三语文10月月考新人教版.doc
- 四川省营山职业高级中学 职业学校课堂教学中的德育教育.doc
- 四科学技术社会观.ppt
- 四项制度八项措施.doc
- 回归凯恩斯和哈罗德.doc
- 团队建设(M).ppt
- 园林预算doc.doc
- 2025年中国民用航空局清算中心招聘应届生4人笔试备考题库及参考答案详解一套.docx
- 2025年中国农业银行河南省分行春季招聘235人笔试高频难、易错点备考题库及答案详解1套.docx
- 2025年中国农业银行黑龙江省分行春季招聘153人笔试高频难、易错点备考题库及完整答案详解1套.docx
- 2025年中国农业银行内蒙古自治区分行度春季招聘186人笔试高频难、易错点备考题库及答案详解1套.docx
- 2025年中国农业银行青海省分行春季招聘48人笔试备考题库及答案详解1套.docx
- 2025年中国农业银行宁夏回族自治区分行春季招聘58人笔试高频难、易错点备考题库含答案详解.docx
- 2025年中央纪委国家监委机关直属单位招聘25人笔试备考题库及参考答案详解一套.docx
- 2025年中国热带农业科学院热带作物品种资源研究所第一批招聘15人笔试高频难、易错点备考题库带答案详.docx
- 2025年中国农业银行新疆生产建设兵团分行春季招聘41人笔试备考题库及答案详解一套.docx
- 2025年中国人民警察大学第二批公开招聘笔试高频难、易错点备考题库参考答案详解.docx
文档评论(0)