数据库全文检索方案建议书.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
厦门巨龙软件工程公司 厦门巨龙软件工程公司 数据库全文检索系统项目建议书 数据库全文检索系统项目建议书 百度在线网络技术(北京)有限公 B (Beijing) Co., Ltd. 2005 年 百度公司版权所有, 2005 本文档涉及百度公司机密 未经百度公司的书面允许,不得对此文档进行复制或传播 目 录 目 录 2 百度在线网络技术(北京)有限公司深圳分公司 1 概述 1.1 现状分析 厦门巨龙软件工程公司是一家专业从事软件开发、系统集成、咨询服务和技术服 务的国家级重点高新技术企业;致力于政府信息化、公安信息化、企业信息化建设;。 各个系统数据繁多,结构化数据和非结构化数据都有,是一个综合信息平台。信息存 储在多个数据库中,随着业务量增长,信息量持续高速增长,数据量庞大(百万级), 数据管理的复杂度大幅增加,特别是对数据库检索提出了更高要求,仅由商业数据库 自身带有的检索功能,随着数据量的增加是远远不能满足用户需求的。目前数据库检 索的存在问题如下: 1. 数据库自身技术存在缺陷 不擅长文本字段检索,不支持两个以上单词复合检索 2. 数据库系统性能限制 在大数据量,多用户进行查询操作时,效率非常低下 检索请求占用数据库大量资源,产生雪崩效应,数据库性能急剧下降 3. 对中文分词处理 商业数据库本身不具备分词的技术,在检索的准确性方面难以保障。 4. 数据库检索不能针对大对象检索。 对于数据库中存储的 BLOB 字段的二进制流的文件,数据库没有检索功能。即对 非结构化数据不支持检索。 百度全文检索系统采用先进的中文分词技术,支持数据量大,访问量高,性能高, 稳定性强,效率高,数据实时同步,能很好为用户提供性能优异的检索服务。 1.2 提供检索服务的必要性 信息只有成功的传递到使用者手中,才能真是体现其价值。因此信息开发和利用 包括两个重要环节:信息的积累和有效传递,二者缺一不可。所以在注重信息积累的 3 百度在线网络技术(北京)有限公司深圳分公司 同时,也要提供查找信息的便利手段,实现信息有效传递,从而完善信息的开发和利 用环节。  数据整合 信息的不断积累造成信息量庞大,并且,信息类型种类繁多。所有各种信息都要 为用户服务。所以作为信息传递之最有效的方式-检索系统,要能对多重信息源 进行整合后,提供检索功能,以确保用户在最短的时间能找到他想要的信息  提高用户检索体验,最大限度方便用户 信息量总在不断增长,日常工作繁忙,事务众多,在浩瀚的数据中,你是否曾为 找不到某个文件而耗费了大量时间?又或者因为查找速度太慢,而放弃?只需一 个专业的检索,这些烦恼就可迎刃而解。 1.3 搜索技术需求说明 1、良好的可扩展性。未来扩展所查询的数据库的内容时,代价最小。 2 、能够提供自定义的输出控制,如结果读取条数、摘要类型等。 3、提供同义词的自定义接口和格式。 4 、提供对多文档的支持,包括Word, Excel, PPT, PDF, txt, HTML 等。 5、提供相关开发接口。 6、多种数据源:多数据库,用户检索时以统一的形式体现。 7、数据同步方式,要求数据可以实时索引;即数据变化发送到检索系统后,检索 系统可以立即反映出来。 8、检索响应速度:1 秒内返回搜索结果。 9、大数据量,大并发用户数 4 百度在线网络技术(北京)有限公司深圳分公司 2 解决方案建议 2.1 建

文档评论(0)

LF20190802 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档