- 1、本文档共58页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
中文 全文数据库索引模型研究 摘要
摘要 在文本信息急剧膨胀和电子图书迅猛发展的今天,文本数据库日益成为信
息技术领域一个重要的研究发展方向。文本数据库在图书馆、办公自动化、软
件工程、自动目录管理和图书与报干0的出版发行以及涉及文本信息存取的其它
都离不开文本数据库的后台支持。本文首先介绍了中文文本数据库的基本体系
和相关概念,然后对目前实用的几种模型算法进行介绍、分析,特别叙述了一
种最新的模型——IS订也E模型,对传统的模型和新兴模型进行文本数据模型
的对比,分析各个模型在空间效率、时间效率、动态性能几个主要方面的优胜
ISTREE模型的索引创建方法、查询以及原文生成算法和目前的研究进展情况,
为大家提出一个新的思路。最后给出实验原型系统的实验结果,分析该模型的
特性、指出发展方向以及应用前景。
关键字:全文数据库、全文索引、ISTREE √ v ~, 中文 全文数据库索引模型研究 摘要 Abstract When thetextinformation andelectronicbooks expandsrapidly develop has textdatabasebecomean research IT
quicklytoday,full importantdirectionin
field after textDatabasehasbeen inthe day day.Full applied othertext
engineer,automaticcatalog and information management,thepublication and fields.Thewebsearch suchasGOOGLE.LYCOS
storage querying engineers
etc.arealso text basedthefull database.Inthis theChinese paper,firstly,we present
textdatabase’Sarchitectureand relative and y,we concepts.Secondlpresentanalyze
severaltextindexmodelsused and inColmnerceresearch
describeanew the model,ISTREE.Thirdly,We comparespaceefficiency,time and these describethe
efficiencydynamic models.Here,we performance among
realizationof model’S ISTREE index and prototype,thebuilding method,querying
the comebackofsourcetextarithineticofthenormalISTREEmodeIits and directanew for
optimized this,we fulltext isthe model.By way database.Finally,it resultsand
experiment analysis. words:Fulltext text database,full
Key index,ISTREE .4. 中文 全文数据库索引模型研究
第一章绪论
1.1研究背景 随着人类社会进入信息时代步伐的加快,信息呈现指数增长的趋势。由于
文本是信息的主要载体之一,因此如何有效地管理文本这种非结构化数据成为
当前一项紧迫的研究任务。全文数据库被认为是解决这个问题的一个有效途径。 全文数据库,也可称为文本数据库,它是管理大量文本的系统。由于传统
数据库擅长于结构化数据的管理,而文本是典型的非结构化数据,它们之间的
巨大差异使得全文数据库的实现手段以及全文索引的结构模型完全不同于传统
数据库,比如关系数据库,因此无法通过对传统数据库技术的移植、借用和变
换等简单方法,而必须研究发现全新的理论和方法来完成这项研究工作。而且
它的研究也能够为其他几种更复杂的信息载体,如声音、图像等的管理的研究
提供重要的经验和基础。 作为一种特殊的数据库系统,全文数据库要完成的工作仍然是传统数据库
的两大功能:存储和检索,具体而言就是文本数据的存储和任意字符串的检索。
后一项功能就是与本文研究密切相关的全文检索。 数据库系统的两大功能中,检索更具有核心的地位,可以认为全文数据库
研究的重点是全文检索,而全文检索的关键又是全文索引。一般全文索引的研
究内容主要有:①索引的空间效率;②索引的
您可能关注的文档
- 试论政治技术问题.pdf
- 特许经营中特许人责任.pdf
- 安徽省中学排球运动队现状调查和分析.pdf
- 关于MVC模式的软件项目管理系统.pdf
- 司法鉴定人法律责任制度地研究.pdf
- 适应高中新课改的高等师范课程改革地研究.pdf
- 重庆电大渝中区分校职业指导课程内容地实施研索.pdf
- 安全和发展的变奏:电子政务建设中的安全观.pdf
- 当代中国报业发行改革探究.pdf
- 安徽超英化妆品公司市场营销管理探究.pdf
- 局机关2025年上半党支部工作总结.docx
- 《党组讨论和决定党员处分事项工作程序规定》交流发言:以《规定》为纲,扎实推进纪检监察工作高质量发展.docx
- 市政府办公室关于学习教育进展情况汇报.docx
- 市委办公室在学习教育督导推进会上的汇报发言.docx
- 学习《党组讨论和决定党员处分事项工作程序规定》交流发言.docx
- 学校开展作风建设专题汇报会上的交流发言.docx
- 市政府办公室在学习教育督导座谈会上的汇报发言.docx
- 严守党纪红线,强化执纪担当——在市纪委理论学习中心组专题学习研讨会上的发言.docx
- 2025年党员领导干部学习《党政机关厉行节约反对浪费条例》研讨会交流发言 (2).docx
- 市人大办公室在学习教育督导座谈会上的汇报发言.docx
最近下载
- 美国fda生产过程(工艺)验证总则指南中英文版.doc VIP
- 成都理工大学2020-2021学年第2学期《环境监测》期末考试试卷及标准答案.docx
- 2024年江苏省无锡市中考英语真题卷(含答案与解析).docx VIP
- 年产水性油墨、凹版塑料环保油墨4500 吨、水性涂料500吨建设项目环评(2021年新版环评)环境影响报告表.pdf VIP
- fda美国食品药物管理局工艺验证指南英文版).doc VIP
- 金属非金属露天矿山建设项目安全设施竣工验收表.pdf VIP
- 单位员工网络安全培训.pptx VIP
- PQE试用期述职报告.pptx VIP
- 《GBT 30130-2023胶版印刷纸》最新解读.pptx
- GJB9001C:2017研发一整套资料模板(共348页).pdf VIP
文档评论(0)