- 1、本文档共28页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* 企业搜索的对象是多样化的,包括数据库的,应用系统的,电子文档以及多媒体数据。 业内最常规的方案是建立一个统一的索引库,基于这个核心索引库来提供搜索服务。因此这个索引库本身的搜索能力(包括功能和性能)都是影响企业搜索引擎的关键因素(这里主要是为了引出TRS DB SERVER做的伏笔,强调索引库的重要作用,也是体现TRS DB SERVER优势的一个前提) 对不同的来源,需要用不同的工具进行整合(按照常规,我们会搬出TRS Gateway等一系列的产品模块来讲资源整合,反而让用户觉得混淆,开始避免讲复杂的整合工具,告诉客户有成熟的工具,能整合即可,点到即止) TRS的一些测试数据佐证 * TRS的一些测试数据佐证 * * * * * TRS DataBase Server 全文数据库 北京拓尔思信息技术股份有限公司 什么是全文数据库 数据库 存储在计算机内的有组织的数据集合 网状 层状 关系型 关系型数据库 全文型数据库 集结构化与非结构化检索于一体的数据库 百度 Google TRS 全文型数据库是以结构化及非结构化数据检索为关注视角(而非实体间如何组织)的数据库技术 各实体与实体之间的联系均用关系模型来表示 Oracle SQLServer DB2 结构化与非结构区别 全文数据库的定位 与关系型数据库相比 与关系型数据库相比 没有触发器,没有事务,没有实体间的关系 有全文索引机制,支持海量数据检索, 支持高并发和快速检索响应,支持相关度排序 全文数据库工作机制 第一步 第三步 使用采集工具采集数据,装入全文数据库 全文数据库通过接口接收到检索请求,进行处理 第二步 全文数据库建立索引 第四步 返回命中结果集 检索结果展现 全文数据库细分 互联网级搜索引擎 企业级搜索引擎 允许有一定的更新延迟 需要快速响应,但只 求查准,不求查全 需要能主动发现新的网页 不允许有延迟 既要查准,也要查全 采集源类型广泛(企业内各型数据) 百度 Google TRS 融合互联网搜索和企业搜索 互联网搜索和企业搜索并非一回事 典型搜索引擎方案系统架构 异构数据统一管理,非结构化和结构化数据联合检索 Oracle, DB2, SQL Server… Notes, 邮件服务器 File System:Word,PDF, EXL Web: HTML, XML Mail, News Audio, Video Flash 结构化数据:SQL查询 非结构化数据:全文检索和搜索引擎 但用户的数据在很多情况下是结构化数据+非结构化数据+半结构化数据 北京拓尔思信息技术有限公司 Core Indexing Server Content Capture Index DATABASE SQL SERVER ORACLE SYBASE DB2 Lotus Domino Website Portal EIP ERP SPS KM CIS File Document Microsoft Office Adobe PDF RTF TEXT XML Multi-Media Video Audio Flash Movie SEARCH Search Application Services 性能测试 数据量 PC Server数目 速度(秒) 1000万 1 关键词检索* 0.075 逻辑表达式** 0.309 2000万 2 关键词检索 0.076 逻辑表达式 0.314 4000万 4 关键词检索 0.103 逻辑表达式 0.377 测试环境:Dell 2850 (2xCPU,4G内存,10000转硬盘,Redhat AS4.0) 性能测试 数据量 并发数 速度(秒) 1000万 1 关键词检索 0.08 逻辑表达式 0.31 10 关键词检索 0.25 逻辑表达式 0.57 50 关键词检索 1.26 逻辑表达式 4.75 100 关键词检索 2.50 逻辑表达式 13.12 TRS全文数据库集群 跨平台支持,多种开发接口 平台: OS:Windows,Linux, Unix。 DB:Oracle, DB2, SQL Server, Sybase 应用服务器:IBM, BEA, Tomcat等 Web服务器:各种Http服务器 开发接口: C/C++ J2EE .NET TRS 搜索引擎行业地位 公司是中文全文检索技术的创始者 公司在2000年首先在国内提出中文内容管理理念和技术 赛迪顾问2008年独立调查数据表明TRS是国内: 企业搜索软件第一名 主要竞争对手均为国际知名厂商 2007年中国企业搜索产品市场主力厂商份额结构 深厚的科研基础和积累 拥有自主核心技术和知识产权,研发力量强大 在信息检索、知识
您可能关注的文档
- thl语文版七年级下第9课《骆驼寻宝记》精品介绍.ppt
- TIMKEN轴承67883-67820CD轴承参数说明介绍.doc
- tiptop培训文档介绍.ppt
- TJ-3标首件制桥面伸缩缝施工方案介绍.doc
- TK-188DVN说明手册介绍.doc
- 基因组和染色体教案分析.ppt
- TL9000Z电话交换机介绍.doc
- TL用户基础与系统管理第一二章介绍.ppt
- TMS320F28XX系列DSP存储器映射图介绍.doc
- TMS320x28xx系列DSP综述0310介绍.ppt
- 2025中国冶金地质总局所属在京单位高校毕业生招聘23人笔试参考题库附带答案详解.doc
- 2025年01月中国人民大学文学院公开招聘1人笔试历年典型考题(历年真题考点)解题思路附带答案详解.doc
- 2024黑龙江省农业投资集团有限公司权属企业市场化选聘10人笔试参考题库附带答案详解.pdf
- 2025汇明光电秋招提前批开启笔试参考题库附带答案详解.pdf
- 2024中国能建葛洲坝集团审计部公开招聘1人笔试参考题库附带答案详解.pdf
- 2024吉林省水工局集团竞聘上岗7人笔试参考题库附带答案详解.pdf
- 2024首发(河北)物流有限公司公开招聘工作人员笔试参考题库附带答案详解.pdf
- 2023国家电投海南公司所属单位社会招聘笔试参考题库附带答案详解.pdf
- 2024湖南怀化会同县供水有限责任公司招聘9人笔试参考题库附带答案详解.pdf
- 2025上海烟草机械有限责任公司招聘22人笔试参考题库附带答案详解.pdf
文档评论(0)