中日友好环境保护中心.DOCVIP

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
中日友好环境保护中心.DOC

中日友好环境保护中心 全文检索系统采购需求文件 一、总体需求 采购北京拓尔思信息技术股份有限公司1套“TRS全文检索系统”具体包括TRS Database Server/TRS Database API/TRS Gateway for RDBMS三个组件。详细技术参数与服务条款如下: 1.TRS全文数据库系统 模块名称 产品编号 规格 运行平台 版本 TRS Database SERVER TRS-EDB–V65D License无限制 Windows Linux 6. 1 TRS Database API API-JAVA-V61 TRS 全文数据库Java应用开发接口 Windows Linux 6. 2. “TRS 全文检索网关”软件 模块名称 产品编号 规格 运行平台 版本 TRS Gateway for RDBMS GW-ORA-V45 TRS for Oracle 8i以上全文检索网关 Windows.5 1 二、TRS全文数据库技术要求 体系结构 支持各种主流操作系统和主流开发平台。 分布式检索和负载均衡 多线程设计,充分发挥SMP机器的优势,支持大量并发用户访问 32位平台64位文件读写,即支持大于2G或4G的大文件 除了基于文本内容的全文检索外,还具备关系数据库一样的字段概念,支持文档的外部特征与正文内容的各种逻辑组合检索。 Plugin机制:支持第三方编写文档过滤插件, 以满足用户对数据加密的高度要求等。需要特别定制,不包括在发行的标准产品中 提供全功能的Unicode版本管理员工具 优化的C/S连接:不需要复杂的连接池处理就能满足应用的扩展性,和MySQL有点类似MySQL does not require complex connection pooling to deliver scalability) 精确计算,准确报告检索记录数。 客户端支持以下三种字符集:GB2312/GBK/GB18030编码,BIG5编码, UTF8编码 内嵌汉语分词统计建立了大量歧义排除规则,有效提高分词准确性同时在不确定情况下冗余切分,提高查全查准率 除汉语外,还支持西文、俄文和阿拉伯文等多种语言的切词。 支持按词索引、按字索引、字词混合索引,追求高查准率的同时提供100%查全的手段实现按需检索。 扩展检索:包括主题词典自动扩展检索、同义词和反义词自动扩展检索、全半角自动扩展检索、简繁体自动扩展检索 自然语言检索:输入一个检索串或一句话,分词后进行高频词过滤、词语个数限定、词语之间的位置关系等处理,根据词语在文章中的位置和频度,以及词语的倒文档频度,计算相关度,按相关度高低排序后输出结果。自然语言检索和扩展检索结合使用能够实现一定程度的智能检索。 支持分词词典、主题词表、同义词、反义词典、禁用词典的维护 支持英文、法文、德文和俄文等10多种语言的词根处理 数据管理及空间膨胀要求 实时动态索引:数据增删改时快速同步更新索引,无需重建整个索引,也无需局部重建索引。即数据维护增删改后马上能够检索出来。 支持Text、HTML、XML、RTF、MS OFFICE文档 Word/Execl/Powerpoint)和PDF文件自动建立索引。 Native-XML数据库 XML文件无需像关系数据库一样分解后存储,支持XML的全息索引,即:任何标记,以及标记的任何属性,都可以用来描述检索目标。 支持多种数据类型(日期,数字, 字符串,文本和二进制类型) 支持多媒体数据的存储管理 高效的数据和索引压缩低空间膨胀率(一般介于0.5~1.0之间) 提供字段的唯一(Unique)特性用于数据的一致性检查 管理员可设置定时优化的时间,降低系统管理的成本 支持NUMBER型字段的三种子类型,即:32位二进制单精度浮点数(7位十进制有符号整数)、64位二进制双精度浮点数(15位十进制有符号整数)以及32位十进制有符号整数 支持检索优先机制:在数据库的维护过程中,如果有检索请求在执行,则在检查点睡眠指定的秒数,以让出CPU时间来尽快地完成检索请求。 支持选择一些常用字段集中存储,提高排序、统计分类和概览的速度。 支持中英文或其它语种的混合检索 结构化与非结构化数据的统一管理:实现结构化和非结构化数据的统一检索,回答基于元数据meta-data)和基于全文full-text)的联合查询。 40种检索运算符。包括外部特征与正文内容的各种逻辑组合检索、位置检索、二次检索渐进检索、历史检索、词根检索、大小写敏感检索 支持基于成本优化的查询算法高效的索引压缩技术SKIP索引跳跃式扫描技术 多库并行检索技术Query-CACHE技术基于词以及词频的bi-gram算法等 支持自动分库Partitioning),充分利用多库

文档评论(0)

zcbsj + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档