TRS搜索引擎和文本挖掘系统研究.pdfVIP

下载本文档

2
0
约6.6千字
约 5页
2018-01-11 发布于未知
举报
版权申诉

TRS搜索引擎和文本挖掘系统研究.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

TRS搜索引擎和文本挖掘系统北京拓尔思信息技术有限公司北京北四环中路35号北京信息科技大学图书馆三层邮编100|01 一、北京拓尔思信息技术有限公司简介北京拓尔思(TRS)信息技术有限公司成立于1993年(原名为易宝北倍信息技术有限公司)，专注于中文信息处理及应用软件产品的研发。TRS技术来源于863计划和其他科技项目的科研成果。TRS公司是中文全文检索的创始者，在企业和互联网搜索、内容管理和文本挖掘等领域具有领先的技术和产品，在大中华地区拥有2000多家企业级用户，是非结构化信息处理技术领域的领导企业，也是中国最大的搜索和内容管理技术和产品供应商。TRS 公司总部设在北京，现有员工200多人。TRS公司成立十余年来，销售收入和利润始终保持持续增长，已发展成为中国从事自主核心技术和自主知识产权软件产品研发的典范企业之一● TRS公司也是联合国计划开发署UNDP援助建设的中文信息处理研究中心的挂靠单位，公司和北京信息科技大学合作成立了TRS软件开放实验室，该实验室得到中央和地方财政专项经费支持。 TRS公司在信息检索、文本挖掘、搜索引擎和内容管理等领域具有长期的研发积累和丰富的成果，特别是这些研发成果的产业化已处于国内外领先地位：TRS信息检索产品占有70％的国内市场；内容管理产品也为国内市场第一名，在2004，2006年均获得中国内容管理成功企业奖；TRS文本挖掘软件TRS CKM是国内外首个推出的多语言文本挖掘软件用户项目中得到成功应用。目前，公司产品已经在国内外得到广泛应用。90％以上的部委，80％以上的省市信息中心，50％以上的报业集团和媒体单位，超过300家的大学院校，一人批^大型企业均为TRS 产品用户．另外TRS产品在中国香港和日本等地也有一批客户，相关产品的累计销售额已达数亿元。 2006年，TRS信息检索系统9月获中国软件行业协会评选的‘2006中国十大创新软件产品”称号；TRS文本挖掘软件获第十届中国国际软件博览会“最具增值潜力软件产品”称号： 2004年．TRS内容管理软件获中国软件协会“金软件”称号。二、TRS全文检索和企业搜索引擎在全文信息检索和企业搜索领域。TRS的核心产品是TRS全文数据库系统(即TRS 信息检索系统)，曾荣获国家科技进步二等奖，其核心功能是实现对非结构化信息的全文检索和统一管理。本产品最新版本TRSDatabaseServer V6．0继承了得到业界厂’泛使用的TRS全文检索系统的全部功能和性能-针对信息内容管理和资源建设的新需求，发展了包括NativeXML支持，Unicode国际化多语言支持，负载均衡和集群检索，自然语言及智能扩展检索等众多新功能，结合TRS领先的结构化和非结构化数据联合查询技术．从而满足了用户对企业搜索的广泛需求。另外，本产品还率先实现了对由我国企业联盟首倡的非结构化数据操作标记语言 (UOML)标准的支持。 TRS全文数据库系统主要功能特点包括：完善的非结构化数据管理一51— · 非结构化／结构化数据的统一管理系统支持包括TEXT、HTML、RTF、MS 种格式文件的存储、索引和检索。支持多媒体数据的存储管理。支持结构化数据类型，如：日期型、字符串、数值型等。 ● 支持XML数据管理、实现XML的全息索引 XML作为一种完整数据类型，XML文件无需像芙系数据库一样分解后存储。支持XML 的全息索引，即：任何标记及标记的任何属性都可以用来作为检索目标。 ● 多语种、多编码管理系统支持中文、英文、法文、德文、俄文、阿拉伯文等十多种语种的存储、索引和检索：系统核心支持GB2312／GBK／GBl8030编码，BIG5编码，UTF8编码。高效、智能的全文检索 ● 多种全文检索手段，检索速度和准确性共达最优允许使用文中的任意字、词、短语、旬和片段进行检索，支持中英文或其它语种的混合检索以及结构化、非结构化数据的混合检索。精确计算，检索速度和准确性共达最优。 ● 全方位检索条件组合，帮助用户实现精确查询系统追求高查准率的同时提供100％商全的