- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
4、互联网信息检索策略 4.3 智能检索/概念检索 Excite使用“智能概念检索”(Intelligent Concept Extraction)技术,通过发现词与概念间存在的关系,会自动加入一些检索词。 如我们输入“elderly people financial concerns”,Excite除找出精确匹配这些词的文献外,还会找出有关“economic status of retired people”,“the financial concerns of senior citizens”等节点。 4、互联网信息检索策略 4.4 字段限定 字段限定指限定词语在文献中出现的部位。大部分系统都可进行字段限定,但是字段的数目和表示方法稍有不同。 4、互联网信息检索策略 4.5 词语检索 在一串词的前后加双引号(“”)或用连字符连接,可限定检索结果中的词语必须以同样的顺序出现且相邻,如“China economic development”。 4、互联网信息检索策略 4.6 其他检索策略 字母大小写:有些系统区分字母大小写,如AltaVista,Infoseek;有些系统不区分大小写,如雅虎。 名词检索:有些系统对名词检索有特殊规定,Infoseek要求人名或地名的首字母大写,如查找电影明星Rock Hudson,假如不大写首字母,则检索系统还会找出rock climbing、rock music、Hudson River等资料。 5、检索结果输出 相关度:找到所有匹配结果以后,大部分系统都按相关性程度降序输出,首先显示相关度高的结果。有些系统还显示相关度大小(百分比)。 大多数检索遵循以下结果显示原则:(1)匹配的词语数目。匹配的词语越多,相关性越高。(2)文献部位。标题中的词比文本和URL中的词权值高。(3)类目综合度。在雅虎类目等级结构中,综合类比专门类权值高。(4)检索词权值。在数据库中检索词出现的频率越低权值越高。 5、检索结果输出 显示格式:大多数系统都可改变显示格式。简短的可只包含标题,详细的可包括标题、摘要、地址、相关度、文件大小等信息。相应地,每页显示的结果数目也会发生改变。 案例:Google 案例:Google Google的基本搜索简洁方便,在输入查询内容后敲一下回车键,或单击“Google 搜索”按钮即可得到相关资料。Google只会返回那些符合用户全部查询条件的网页,不需要在关键词之间加上“and”或“+”。 Google不仅能搜索出包含所有关键词的结果,并且还对网页关键词的接近度进行分析,按照关键词的接近度确定搜索结果的先后次序,优先考虑关键词较为接近的结果。 案例:Google Google储存网页的快照,当存有网页的服务器暂时出现故障时,用户仍可浏览该网页的内容。如果找不到服务器,Google储存的网页快照也可救急。 可利用Google目录根据主题来缩小搜索范围。例如,在Google目录的ScienceAstronomy类别中搜索“Saturn”,可以找到只与Saturn(土星)有关的信息。而不会找到“Saturn”牌汽车、“Saturn”游戏系统,或“Saturn”的其他含义。 案例:Google Google能够提供与原搜索相关的搜索词。这些相关的搜索词是根据过去Google所有用户的搜索习惯和 Google 提供的计算两个搜索词之间相关度的独家技术而产生的。 通过包含特殊操作符“define:”,并使该操作符与需要其定义的字词之间不留空格,还可获得定义的列表。例如,搜索“define:HTML”将显示从各种在线来源收集到的“HTML”定义的列表。 第二节 门户网站 门户(Portal),原意是指正门、入口,现多用于互联网的门户网站和企业应用系统的门户系统。 门户网站是指通向某类综合性互联网信息资源并提供有关信息服务的应用系统。 1、门户网站与新闻网站 简单回顾门户网站的起源和历史,可以让我们清楚地看到,无论是搜索还是新闻,都只是门户网站发展的一个阶段,门户网站可以从搜索服务演进到新闻服务,未必就不能从新闻服务演进到别的什么服务。 新闻网站指以经营新闻业务为主要生存手段的网站,包括国家大型新闻门户网站(如新华网等)、商业门户网站(如网易等)、地方新闻门户网站(如长江网等),还有各种行业门户网站(如湖
原创力文档


文档评论(0)