- 1、本文档共38页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
libxml2不推荐因为有内存泄漏的情况
附: B树的实现 +++ aboard ? 0 √ abode ? 1 √ abort ? 2 √ abound ? 3 √ about ? 4 √ above ? 5 √ absurd ? 6 √ 0 Memory: Disk: 3 1 5 6 4 2 5 6 4 2 假设我们试图查找单词“above”: 依然只能在右子树,加载右子树的块,找到元素“5” 附: B树的实现 +++ aboard ? 0 √ abode ? 1 √ abort ? 2 √ abound ? 3 √ about ? 4 √ above ? 5 √ absurd ? 6 √ 0 Memory: Disk: 3 1 5 6 2 5 6 4 2 假设我们试图查找单词“above”: 由于在找到元素5时,中间结点已没有作用了,所以它可以换回磁盘 附: B树的实现 +++ aboard ? 0 √ abode ? 1 √ abort ? 2 √ abound ? 3 √ about ? 4 √ above ? 5 √ absurd ? 6 √ 0 Memory: Disk: 3 1 5 6 2 5 6 4 2 这样,内存中真正存储的,只有根结点所在块与正在搜索的中间结点,充分节省内存的使用 附: B树的实现 +++ aboard ? 0 √ abode ? 1 √ abort ? 2 √ abound ? 3 √ about ? 4 √ above ? 5 √ absurd ? 6 √ 0 Memory: Disk: 1 3 1 4 2 5 6 4 2 当然,为了实际性能考虑,可以将较低的几层缓存在内存中, 或者用LRU等策略,把最常使用到的块缓存在内存中 附: B树的实现 ++++ B树本质上是一个mapkey, value,也可以是一个setkey 在刚刚的例子中,我们用到type(key) == int 实际处理时,这可以充分加以拓展 由于其数据结构是普适的: 用在词典上,key = 词项, value = NULL 用在倒排表上, key = 词项/词项id, value = 倒排文件的指针 用在位置链表上,key = 文档id, value = 位置文件的指针 用在拼写校正上, key = k-gram, value = 对应的词项 附: B树的实现 +++++ B树的一个变种, B+树,可以用来收集一个范围内的所有数据 0 1 2 3 1 4 5 5 3 6 key范围为[3,6]的所有词 总结 前瞻性的设计非常重要,希望大家能借鉴往年的作业要求 推荐在实现过程中编写部分测试样例,保证版本更新时的正确性 为了后期的大数据处理,前期要充分利用RCV1的数据集进行性能提升 推荐学习一下B/B+树的使用 Thank You ! * ? 2006 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION. * Introduction? * ? 2006 Microsoft Corporation
您可能关注的文档
- 910会议室1a-0东海大学海洋学部.pdf
- 803ahepon相关标准学习笔记-通信企业综合业务管理解决方案.ppt
- 1892年洛伦兹提出收缩假设-课程中心.doc
- 2008南区技专校院师生产学合作实务专题制作竞赛-国立澎湖科技大学.doc
- 2010年新投标品种资料审核结果第1页共56页.pdf
- 1002hd模块化插卡式sdi视频分配器用于矩阵级联接线示意图.ppt
- 2011江西基层医疗卫生机构基本药物集中招标采购实施方案.doc
- 2011年一季度汽车行业统计分析-上海汽车行业协会.doc
- 2013大会-北海道自然史研究会.pdf
- 2013年云计算架构与最佳实践高级培训班4-苏州软件行业协会.doc
文档评论(0)