TRS培训总结交流--黄孝艳.ppt

  1. 1、本文档共29页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* * 网关或适配器-?数据库服务器-?管理工具(客服端) -?开发接口-?内容发布应用服务器-?网页浏览器 前两个软件平台是国家配发,本次培训内容较少涉及。我们项目的重点使用平台是TRS Server全文数据库系统和TRS全文数据库API。全文检索网关主要实现关系型数据库向TRS全文检索数据库进行数据迁移的工具,企业搜索应用适配器-File主要实现物理磁盘与TRS的数据迁移。都实现C/S版本了.除国家配置的外,其余的都是试用版,部署情况。 * 以下特征: 结构化与非结构化数据的统一管理:实现结构化和非结构化数据的统一检索,回答基于元数据(meta-data)和全文(full-text)的联合查询。 ? 实时动态索引:数据增删改时快速同步更新索引,无需重建整个索引,也无需局部重建索引。即数据增删改后立即能够被检索。 ? 自动分库(Partitioning):充分利用多库并行检索技术,进一步提高了检索速度;使得数据加载速度保持稳定,进一步提高了数据更新速度。 ? 支持GB18030和UTF8大字符集:便于对中文偏僻字和世界各国文字的支持。 ? Native XML支持:能够为更精确的检索提供存储和检索手段。XML文件无需关系数据库一样分解后存储,支持XML的全息索引,即任何标记,以及标记的任何属性,都可以用来描述检索目标。 ? 中文字词混合索引:由于中文的特殊性,存在字词索引的问题,按字索引保证百分之百的查全率;按词检索保证一定的查准率,并且可以维护分词词典,通过对词典的训练,逐步提高检索查准精度。所以中文检索系统需要提供一种索引方式,以保证一定查准率的同时提供百分之百查全的手段。 ? 分布式与负载均衡:提供分布式检索和负载均衡集群服务器,实现分布式检索和负载均衡功能,满足大数据量和高并发的检索要求。 ? 快速返回结果:重新设计的检索算法更加高效快速,同时还具有快速返回部分检索结果的能力,使应用展现更加灵活方便。 ? 集成性:提供运行版,支持与其它产品的集成;支持第三方提供的文档过滤插件,以满足用户对非文本数据的检索要求。 ? 优化的C/S连接:不再需要复杂的连接池处理就能满足应用的扩展性,具有和MySQL类似的特点(MySQL does not require complex connection pooling to deliver scalability * * P o w e r B a r 中国专业PPT设计交流论坛 * TRS 原理 全文检索是计算机程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置。当用户查询时根据建立的索引查找,类似于通过字典的检索字表查字的过程。TRS Server是按照全文检索理论建立起来的用于提供全文检索服务的软件系统。 * 体系结构 数据库服务器 管理 员工具 网关或适配器 开发包 内容发布应用服务器 TRS 软件平台介绍 一、 TRS Server全文数据库系统 二、 TRS 全文检索网关(DB2) 三、TRS 全文检索网关(Oracle) 四、TRS全文检索网关 (MS SQL) 五、TRS企业搜索应用适配器-File 六、TRS全文数据库API * ----8 ----8 ----3 ----4 ----4 ----JAVA包 一、 TRS Server全文数据库系统 TRS全文数据库服务器的核心技术为全文检索全文数据库=全文检索+关系数据库的基本关系特征+Native-XML数据库特性; 核心功能:对结构化和非结构化信息的统一存储管理;基于元数据和全文的联合查询。 * 管理员工具的作用 TRS管理员是TRS信息发布检索系统的客户端管理工具,主要用于对各种TRS对象进行管理、设计和维护等,并具备完整的检索、浏览和维护功能。 启动与退出 [前提条件] :TRS服务器处于启动状态 双击桌面上“TRS管理员工具”图标 输入: TRS 服务器地址 端口号 用户帐号名 口令字 第一次进入用系统默认管理员帐号名(system) 和口令字(manager)登录 可退出登录并用其他用户的身份重新登陆 用户组:系统安装时,将自动创建两个用户组/用户: administrator/system/和guest/pub。 用户: 数据库----相当于关系型数据库的一张表 视图(视图字段):一个或几个结构完全相同的数据库的集合,这样可以提高查询速度. 视图包含的数据库均以AS$开头;视图包含的数据库有顺序,对视图进行装库,相当于对最后一个数据库装库;当最后一个数据库的记录数超过设定值,视图会自

文档评论(0)

151****0104 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档