《农业信息垂直搜索引擎研究报告》.docVIP

《农业信息垂直搜索引擎研究报告》.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《农业信息垂直搜索引擎研究报告》

农 业 信 息 垂 直 搜 索 引 擎 研 究 报 告 所 在 院 系 计算机技术与工程学院 学 科 专 业 农业信息化 研究生姓名 宋 玲 指 导 老 师 高 静 2013-10-12 目录 目录 1 第一章 垂直搜索引擎综述 2 1.1搜索引擎的发展 2 1.2搜索引擎工作原理 3 1.3垂直搜索引擎定义 5 1.4垂直搜索引擎的特点 5 1.5垂直搜索引擎的典型列子 6 第二章 农业信息垂直搜索引擎 8 2.1 国内外发展现状 8 2.1.1国外农业搜索引擎的研究现状与发展 8 2.1.2国内农业搜索引擎的研究现状与发展 9 2.2农业信息搜索引擎主要特点 9 2.3农业信息搜索引擎结构 10 第三章 农业信息垂直搜索引擎的关键技术 13 3.1 信息抽取技术 13 3.2信息过滤技术 14 3.2.1 布尔模型 15 3.2.2 向量空间模型 15 3.2.3 潜在语义模型 15 结语 16 参考文献 17 第一章 垂直搜索引擎综述 1.1搜索引擎的发展 搜索引擎(SearchEngines)就是指在Web环境中能够响应用户提交的搜索请求,返回相应的查询结果信息的技术和系统,是在互联网上可以查询网站或网页信息的工具。它包括信息抓取、信息处理和用户查询三部分。搜索引擎的服务方式分为两种:目录服务和关键字检索服务。目录服务是由分类专家将网络信息按照主题分成若干个大类,用户可以根据分类清晰地找到自己所需要的内容;关键字检索服务可以查找包含一个或多个特定关键字或词组的WWW站点。搜索引擎是互联网的第二大核心技术,涉及到信息检索、人工智能!计算机网络、分布式处理、数据库、数据挖掘、数字图书馆、自然语言处理等多领域的理论和技。所以具有综合性和挑战性 1990年以前,没有任何人能实现搜索互联网的功能。互联网发展早期,信 息量较少,互联网用户多为专业人士,那时查找信息要相对容易。伴随互联网爆 炸性的发展,普通网络用户想找到所需的资料简直如同大海捞针。这时为满足大 众信息检索需求的搜索引擎便应运而生了。所有搜索引擎的祖先,都可以追溯到 1990年由蒙特利尔MeGill大学学生AlanEmtage,PeterDeutseh,Billwheelan发明的Arehie(ArehieFAQ)。虽然当时WorldWideWeb还未出现,但因为当时网络的主要用途是传输文件,网络中的文件传输还是相当频繁。由于大量的文件散布在各个分散的FTP主机中,查询起来非常不便,因此AlanEmtage想到了开发一个可以以文件名查找文件的系统于是便有了Archie。 1993年,美国内华达SystemComputingServiCeS大学开发了一个与Arehie 非常相似的搜索工具,这个搜索工具既能够检索文件也能够检索网页。 1994年4月,斯坦福(Stanford)大学的两名博士生:DavidFilo和美籍华人杨致远(GerryYang)共同创办了超级目录索引Yahoo,并成功地使搜索引擎的概念深入人心,从此搜索引擎进入了高速发展时期。 1998年,斯坦福大学的两位博士生LarryPage和SergeyBrin开发出了现在世界上最大的搜索引擎一代:oogle。通过对20多亿网页进行整理,Google可为世界各地的用户提供所需的搜索结果,而且搜索时间通常不到半秒,现在,Google每天需要为世界各国用户提供1.5亿次查询服务。 1997年10月29日,北大天网正式在CERNET上向广大Internet用户提供 Web信息导航服务,它是由北大计算机系网络与分布式系统研究室开发的国家“九五”重点科技攻关项目“中文编码和分布式中英文信息发现”的研究成果。 受到学术界广泛好评。 2000年1月,两位北大校友,前工nfoseek资深工程师李彦宏与加州大学伯 克利分校博士后徐勇在北京中关村创立了百度(Baidu)公司,历经5年的高速发展后,在近两年时间里,百度高居全球网站流量前八名的位置,已经成为全球十大网站之一。百度每天接受着超过一亿人次来自各个方面的内容检索请求。中国9400万网民几乎每天使用1次百度。“有问题百度一下”已经成为中国网络流行语之一。 2002年,中国搜索(原慧聪搜索)正式进入中文搜索引擎市场,在一年多的时间里,就发展为全球著名的中文搜索引擎服务商,为新浪、搜狐、网易、TOM 等知名门户网站提供搜索引擎技术。慧聪搜索引擎的优势是从人工审核网站信息 源和设置禁查词两个方面入手,有效地过滤了不良信息,降低了垃圾信息的含量。 在互联网实时新闻搜索方面,慧聪也实现了网络新闻的实时检索。目前,出现了 大量多方向的搜索引擎系统,搜索引擎进入了快速发展阶段。

文档评论(0)

shiguda + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档