- 3
- 0
- 约2.49万字
- 约 117页
- 2017-02-09 发布于河南
- 举报
2.5.2 邻近结点模型 Navarro和Baeza-Yates提出了一种新的模型,该模型允许在相同文档的文本上定义独立分层(非扁平的)索引结构。每个索引都有严格的层次结构,即由章、节、段、页、行所组成,这些结构单元通常称之为结点,如下图所示。每个这样的结点都与一个文本区域相关。此外,两个不同的层次结构可能会涉及到重叠的文本区域。 对于涉及不同层次结构的用户查询而言,所汇集的结果只能由来自其中一个层次结构的所有结点形成。因此,最终结果不能由两个不同层次的结点所组成,这样做的目的是允许以较少的表达式获得较快的查询处理。然而应该考虑到,由于结构是层次型的,在结果集中允许出现来自于相同层次的嵌套文本区域。 * 2.5.2 邻近结点模型 结构化单元的层次索引和词的扁平索引 * 2.5.2 邻近结点模型 上图给出了一个具有4个层次的层次索引结构,它们分别对应于同一篇文档中的章、节、子节和子子节,图中还给出了词“大爆炸”的倒排列表。倒排列表中的项,列出了文档文本中所有出现单词“大爆炸”的位置。在这个层次结构上,每个结点指明了结构化单元(如章、节、子节、子子节)在本文中的位置。 * 2.5.2 邻近结点模型 查询语言允许为字符串检索指定正则表达式,通过名称(如搜索章节)来引用结构成分,也可以是它们的组合。从这种意义上来说,可以把这个模型看成是表达与高效之间的一种折中。查询语言的某些限制性表
您可能关注的文档
- 新生儿窒息复苏第1课课件.ppt
- 新生儿窒息复苏新理念药物治疗幻灯片.ppt
- 新生儿窒息复苏原则04085幻灯片.ppt
- 新生儿窒息复苏原则课件.ppt
- 新生儿窒息新进展课件.ppt
- 新生儿重症监护护课件.ppt
- 新型流行性感冒防治课件.ppt
- 新修订《药品经营质量管理规范》幻灯片.ppt
- 新药申报-注册管理课件.ppt
- 新药战略体系建立课件.ppt
- 2025年下半年小学教师资格考试简答题汇总.pdf
- 护理教学比赛资源整合.pptx
- 2022泰和安消防 JTGB-HM-TX3H01 JTGB-HM-TX3H02 TGB-HM-TX3H03 系列点型红外火焰探测器.docx
- 2025年驾驶证资格考试最新最全交通标志大全.pdf
- 护理教学理念:更新与发展.pptx
- 2025年新驾考科目一巧记速记口诀(全国通用).pdf
- 2025年一级建造师《项目管理》黄金预测考点【打印版】.pdf
- 证券公司高级管理人员资质测试章节练习-第一部分综合类第六章至七章:证券投资基金法、信托法.pdf
- 护理教学研究:方法与成果.pptx
- 麻纺车间设备更新准则.docx
最近下载
- 工程勘察设计收费标准(2002年修订本)完整版.pdf
- 北师大版(2024)新教材小学二年级数学下册第五单元《图形王国》精品课件.pptx VIP
- 中微公司成都研发及生产基地暨西南总部项目环评报告表.docx
- 2025年河南工业和信息化职业学院单招职业技能测试题库含答案.docx VIP
- 《动物防疫监督》课件.ppt VIP
- 2025年河南工业和信息化职业学院单招职业技能测试题库(含答案).docx VIP
- 05s502图集阀门井图集 .docx VIP
- 煤矿新工机电培训课件.ppt VIP
- ”小学数学阅读策略初探“小课题研究申报表 .pdf VIP
- 托福阅读71套TPO(含答案).pdf VIP
原创力文档

文档评论(0)