- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
中日友好环境保护中心.DOC
中日友好环境保护中心
全文检索系统采购需求文件
一、总体需求
采购北京拓尔思信息技术股份有限公司1套“TRS全文检索系统”具体包括TRS Database Server/TRS Database API/TRS Gateway for RDBMS三个组件。详细技术参数与服务条款如下:
1.TRS全文数据库系统 模块名称 产品编号 规格 运行平台 版本 TRS Database
SERVER TRS-EDB–V65D License无限制
Windows
Linux 6. 1 TRS Database
API API-JAVA-V61 TRS 全文数据库Java应用开发接口 Windows
Linux 6. 2. “TRS 全文检索网关”软件 模块名称 产品编号 规格 运行平台 版本 TRS Gateway for RDBMS GW-ORA-V45 TRS for Oracle 8i以上全文检索网关 Windows.5 1
二、TRS全文数据库技术要求
体系结构 支持各种主流操作系统和主流开发平台。
分布式检索和负载均衡
多线程设计,充分发挥SMP机器的优势,支持大量并发用户访问
32位平台64位文件读写,即支持大于2G或4G的大文件
除了基于文本内容的全文检索外,还具备关系数据库一样的字段概念,支持文档的外部特征与正文内容的各种逻辑组合检索。
Plugin机制:支持第三方编写文档过滤插件, 以满足用户对数据加密的高度要求等。需要特别定制,不包括在发行的标准产品中
提供全功能的Unicode版本管理员工具
优化的C/S连接:不需要复杂的连接池处理就能满足应用的扩展性,和MySQL有点类似MySQL does not require complex connection pooling to deliver scalability)
精确计算,准确报告检索记录数。 客户端支持以下三种字符集:GB2312/GBK/GB18030编码,BIG5编码, UTF8编码
内嵌汉语分词统计建立了大量歧义排除规则,有效提高分词准确性同时在不确定情况下冗余切分,提高查全查准率
除汉语外,还支持西文、俄文和阿拉伯文等多种语言的切词。
支持按词索引、按字索引、字词混合索引,追求高查准率的同时提供100%查全的手段实现按需检索。
扩展检索:包括主题词典自动扩展检索、同义词和反义词自动扩展检索、全半角自动扩展检索、简繁体自动扩展检索
自然语言检索:输入一个检索串或一句话,分词后进行高频词过滤、词语个数限定、词语之间的位置关系等处理,根据词语在文章中的位置和频度,以及词语的倒文档频度,计算相关度,按相关度高低排序后输出结果。自然语言检索和扩展检索结合使用能够实现一定程度的智能检索。
支持分词词典、主题词表、同义词、反义词典、禁用词典的维护
支持英文、法文、德文和俄文等10多种语言的词根处理 数据管理及空间膨胀要求 实时动态索引:数据增删改时快速同步更新索引,无需重建整个索引,也无需局部重建索引。即数据维护增删改后马上能够检索出来。
支持Text、HTML、XML、RTF、MS OFFICE文档 Word/Execl/Powerpoint)和PDF文件自动建立索引。
Native-XML数据库 XML文件无需像关系数据库一样分解后存储,支持XML的全息索引,即:任何标记,以及标记的任何属性,都可以用来描述检索目标。
支持多种数据类型(日期,数字, 字符串,文本和二进制类型)
支持多媒体数据的存储管理
高效的数据和索引压缩低空间膨胀率(一般介于0.5~1.0之间)
提供字段的唯一(Unique)特性用于数据的一致性检查
管理员可设置定时优化的时间,降低系统管理的成本
支持NUMBER型字段的三种子类型,即:32位二进制单精度浮点数(7位十进制有符号整数)、64位二进制双精度浮点数(15位十进制有符号整数)以及32位十进制有符号整数
支持检索优先机制:在数据库的维护过程中,如果有检索请求在执行,则在检查点睡眠指定的秒数,以让出CPU时间来尽快地完成检索请求。
支持选择一些常用字段集中存储,提高排序、统计分类和概览的速度。 支持中英文或其它语种的混合检索
结构化与非结构化数据的统一管理:实现结构化和非结构化数据的统一检索,回答基于元数据meta-data)和基于全文full-text)的联合查询。
40种检索运算符。包括外部特征与正文内容的各种逻辑组合检索、位置检索、二次检索渐进检索、历史检索、词根检索、大小写敏感检索
支持基于成本优化的查询算法高效的索引压缩技术SKIP索引跳跃式扫描技术 多库并行检索技术Query-CACHE技术基于词以及词频的bi-gram算法等
支持自动分库Partitioning),充分利用多库
您可能关注的文档
- 中国房地产十强碧桂园集团开启全球人才招募之旅.DOC
- 中国石油学会百篇优秀论文评选通知.PDF
- 中国营养学会营养科研基金帝斯曼专项科研基金.DOC
- 中国酒店发展报告.PDF
- 中美数据好于预期而美国政府关门大限将至.PDF
- 中美淋巴瘤研讨会(第一次通知).PDF
- 中铁油料集团应聘登记表.DOC
- 丰台区第二十一届学生艺术节展演节目要求.PDF
- 临安市主要农地土壤酸化特征及其改良技术探讨.PDF
- 乐陵市人民医院迁建项目室内外标识牌制作及安装工程.DOC
- 2025年01月复旦大学附属华山医院东院公开招聘笔试历年专业考点(难、易错点荟萃)附带答案详解.docx
- 2025火电电力职业鉴定经典例题带答案详解(能力提升).docx
- 2025火电电力职业鉴定经典例题及答案详解【基础+提升】.docx
- 志愿者知识培训和发展管理.pptx
- 2025火电电力职业鉴定经典例题及完整答案详解【名校卷】.docx
- 2025年01月复旦大学附属华山医院北院公开招聘笔试历年专业考点(难、易错点荟萃)附带答案详解.docx
- 张小明中医课件.pptx
- 2025火电电力职业鉴定经典例题含完整答案详解【有一套】.docx
- 2025火电电力职业鉴定练习题(B卷)附答案详解.docx
- 党员改进作风措施总结.pdf
最近下载
- 高中数学第四章定积分4.3定积分的简单应用4.3.2简单几何体的体积教案.docx VIP
- TZSQX008-2020建设工程全过程质量行为导则.docx VIP
- 2024年山东省高中学业水平合格考生物试卷试题(含答案详解).docx VIP
- 高级教师职称评审答辩简答题.doc VIP
- 禁毒情报学习通超星期末考试答案章节答案2024年.docx VIP
- 北京市2024年艺术类专业考生综合分分数分布(一分一段表).pdf VIP
- 2025年乳腺癌诊疗指南(doc14页) .pdf VIP
- 篮球的起源与发展ppt课件.pptx VIP
- 网上调查赚钱经验及技巧总结.doc VIP
- ALPHA AS100说明书-V102用户手册.pdf
文档评论(0)