百度搜索引擎—信息检索作业.ppt

  1. 1、本文档共80页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
百度搜索引擎—信息检索作业

百度搜索引擎简介 — 信息检索设计题 题目:百度搜索引擎 姓名:刘庆 学号:0543031212 班级:电气学院32班 —— 百度,2000年1月创立于北京中关村,是全球最大的中文网站、最大的中文搜索引擎。 2000年1月1日,公司创始人李彦宏、徐勇从美国硅谷回国,创建了百度。创立之初,百度便将“让人们更便捷地获取信息”作为自己的使命,并为此始终如一、不懈地努力奋斗。 2000年5月,百度首次为门户网站——硅谷动力提供搜索技术服务,之后迅速占领中国搜索引擎市场,成为最主要的搜索技术提供商。2001年8月,发布B搜索引擎Beta版,从后台技术提供者转为面向公众独立提供搜索服务,并且在中国首创了竞价排名商业模式,2001年10月22日正式发布Baidu搜索引擎。 2003年12月,开创性地推出贴吧,开搜索社区化之先河。 2005年8月5日,百度在美国纳斯达克上市,成为2005年全球资本市场上最为引人注目的上市公司。 2008年1月23日,百度日本公司正式运营,百度全面启动国际化战略。 百度坚信,让人们更便捷地获取信息,让人类的智慧相互沟通与交融,即有利于人类智慧的发展,也有利于促进人们的平等,推动社会的进步。 百度网页搜索四大优势 《大英百科全书》——世界上内容最全面的百科全书,有1米多厚、33141页、4300万字,百度超过10亿网页的数据库,相当于3万部《大英百科全书》。 搜索引擎抓取(Spider)网页并不困难,但要在所有网页中甄别优劣、去粗取精,依赖的是全面而强大的中文信息处理技术。 百度中文数据库不仅最全,更是最有质量的。 百度网页搜索四大优势 世界瞬息万变,娱乐圈中两位大腕“黄霑”,“傅彪”的挥别,在第一时间就可以在百度检索到;胜利闭幕的“冬奥”,最近的热点“两会”,百度都能实时呈现! 全球第一的数据挖掘、分布式索引和检索技术与处理速度,以及大规模的工业级系统的开发,支持百度以最快的速度呈现世界新近发生的一切。 百度网页搜索四大优势 眼睛眨一下,只需0. 1秒! 您知道吗?在眨眼的1/100的时间里,百度检索到的资料就达3万部《大英百科全书》,即10亿页;若将他们一本本摞起来,厚度达30多公里;若将他们一页页的接起来,可绕地球500圈! 百度首页不到4K,最干净、最简洁的页面,随区域合理密布的多组服务器机群,架构于强大的网通及电信的骨干网上,可以在瞬间呈现搜索结果。 百度网页搜索四大优势 在现实生活中,王义夫的百发百中不是每一个人都能做到的。 但是在百度,您却能真实体验到准确无误的搜索快感。例如一个关键词,可以找到几十万个相关网页结果,但哪些才是您真正需要的呢?大海捞针,百度帮您精准定位,想您所想,给您所要。 中国人最懂中文,中国人最懂中国人的思维。 百度拥有全球第一的网页分析技术、世界上独一无二的“中文分词”技术及全球最完善的反垃圾网页技术与流程,因此,百度最为准确。 百度主页—简洁明了的界面 百度高级搜索 百度功能 特色 贴吧 :2003年12月,百度开创性地推出贴吧,开搜索社区化之先河。在这里可以搜索到各种热点冷点或者大部分你想关心的帖子。也随着网站平台的加大而不断扩充中。 知道:通过网上提问的方式解决平时不容易处理,不容易找到办法的,棘手的问题。目前已解决问题数—4600万。 结束语 百度引擎功能强大,使用人性化,是全球最大的中文搜索引擎。有别于google引擎对学术库的极大丰富,百度更贴近生活,适合中国人使用。“贴吧”,“知道” ,都体现了中国用户共同解决问题的传统美德。由于百度,生活也会有更多的轻松,方便,健康。 搜索技巧 怎样成为搜索高手——选择适当的查询词 搜索技巧,最基本同时也是最有效的,就是选择合适的查询词。选择查询词是一种经验积累,在一定程度上也有章可循: 表述准确 百度会严格按照您提交的查询词去搜索,因此,查询词表述准确是获得良好搜索结果的必要前提。 一类常见的表述不准确情况是,脑袋里想着一回事,搜索框里输入的是另一回事。 例如,要查找2004年国内十大新闻,查询词可以是“2004年国内十大新闻”;但如果把查询词换成“2004年国内十大事件”,搜索结果就没有能满足需求的了。 另一类典型的表述不准确,是查询词中包含错别字。 例如,要查找林心如的写真图片,用“林心如写真”,当然是没什么问题;但如果写错了字,变成“林心茹写真”,搜索结果质量就差得远了。 不过好在,百度对于用户常见的错别字输入,有纠错提示。您若输入“林心茹写真”,在搜索结果上方,会提示“您要找的是不是: 林心如写真”。 查询词的主题关联与简练 目前的搜索引擎并不能很好的处理自然语言。因此,在提交搜索请求时,您最好把自己的想法,提炼成简单的,而且

您可能关注的文档

文档评论(0)

pangzilva + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档