untitled - 图灵社区.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
untitled - 图灵社区

译者序 《自制搜索引擎》一书终于和读者们见面了,“自制”系列图书的家族 中又多了一名新成员。近几年,图灵先后出版了几本“自制”系列图书, 如《30 天自制操作系统》《自制编程语言》《两周自制脚本语言》等。在这 些书中,我们不用去读枯燥乏味的原理和晦涩难懂的算法,只需跟随作者 的脚步,即可从零开始,一步步地创造出操作系统或编程语言的雏形。 《自制搜索引擎》一书也不例外。在这本不到200 页的书中,作者 先用简明扼要、通俗易懂的语言为我们讲解了搜索引擎的结构及核心概 念,紧接着又带领我们剖析了一个名为wiser 的原创搜索引擎的源代码。 理论与大量源代码的结合帮助我们迈入了搜索引擎的大门,只要用心阅 读并实际操作,就能制作出一个可以在计算机上运行的简易搜索引擎。 然而与其他计算机技术一样,虽然搜索引擎的入门很简单,但要成为这 个领域的技术专家却并不容易,离不开大量的知识积累和实践。所以在 分析完源代码以后,作者又带领我们优化了现有的wiser 搜索引擎,并 简单地介绍了一些更加专业的知识,以启发我们深入思考,为进一步学 习铺平了道路。 阅读本书几乎不需要任何有关搜索引擎的知识储备,但由于wiser 是用C 语言编写的,所以您最好还是能有些C 语言的编程经验。“啊, 用C 写的啊?”也许您也和我当初一样,一听是C 语言就泄气了。的确, C 语言不是那么好用。指针是个难点不说,有些语句的写法也显得很诡 异,而且还缺乏丰富的内置函数和数据结构。但如果您坚信某某语言才 是世界上最好的语言,并要因此放弃本书的话,那么我建议您先下载 wiser 的源代码读一读再做决定。wiser 的源代码仅有大约2600 行。即使 vi  译者序 只瞥一眼,也应该能够发现这些源代码不但具有详细的注释、清晰的结 构,而且遵循了良好的命名规范。仔细地阅读后,甚至还能看到有些 地方应用了回调函数、设计模式等所谓的“现代”编程技巧。不仅如 此,作者还通过引入了名为uthash 的代码库简化了对字符串、列表和 哈希表的操作。例如要向列表中添加元素时,只需使用形如“LL_ APPEND(*list, element);”的一行代码,这就大大增加了代码的可读性。 相信您读到最后也会由衷地感叹:原来C 语言也能这么好用啊。 对于想要开发搜索引擎的读者来说,本书的作用自不必说。而对于 专注于其他领域的开发者,甚至对于那些只是想学门新技术来娱乐一下 的程序员来说,读读本书也是大有裨益的。例如,我们可以从中学到如 何高效地求得多个大集合的交集,如何压缩存储大量的整数,如何运用 sar 命令查看并分析系统的性能等。即使我们不从事搜索引擎的开发工 作,这些算法和技术也会对日常的工作有所启发和帮助。所以,读过了 本书,就算您并不打算做一个搜索引擎出来,也能得到一些收获。 值得一提的是,在本书中很多叙述得较为简练甚至一笔带过的段落 中,其实隐藏着大量的知识。在掌握了搜索引擎的核心技术后,不妨查 查资料、写写代码,试着去掌握这些更高级的知识,搞清楚里面专业术 语的含义。例如,书中提到了字典树(Tier )、Suffix Array 等国内教材 中罕见的数据结构,那么我们能不能用自己熟悉的编程语言实现它们? 作者开发的开源搜索引擎Groonga 采用了内存映射文件技术,那么内存 映射文件的机制是什么……在不断探索这些问题的过程中,我们不但能 把这本不算厚的书读得越来越厚,也能使自己的知识量不断增长。 最后,在这里衷心感谢在翻译过程中给予我支持与鼓励的各位。欢 迎诸位读者批评指正,提出宝贵的建议。希望所有对搜索引擎感兴趣的 读者都能从本书中获益。 胡屹 2015 年 10 月于北京 前言 本书聚焦于Google 和Yahoo! 等Web 检索服务幕后的搜索引擎,旨 在阐明这种系统内部的工作机制。诸位读者通过第 1 章的学习,掌握了 搜索引擎的基础知识和原理之后,就可以从第2 章开始,对照着示例搜 索引擎的源代码体验搜索引擎的开发过程了。这种原理和实践的有机结 合,有助于大家更加深入地理解搜索引擎的构造。 一直在企业和大学从事搜索引擎研发工作的山田负责搜索引擎原理 的写作,并完成了整体构思和统稿的工作。开源搜索引擎Senna/ Gr

文档评论(0)

yanpizhuang + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档