搜索引擎解决方案.ppt

  1. 1、本文档共47页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* * * * * * * TRS搜索引擎的目的——在于专业化行业信息服务(再利用)、提供智能化知识服务,而不仅仅是“找到”信息。 * TRS CKM产品描述 国内外第一套成熟的中文文本挖掘技术,文本挖掘是数据挖掘的一个分支,它是进行知识管理的基础和关键技术。 TRS CKM 有效结合自然语言处理技术、人工智能技术、知识库以及统计分析技术,实现了商业化应用。 在863等多次评测中均名列前茅。 内容管理技术和产品 内容服务平台 内容采集创建 网络信息采集 信息采集网关 多媒体采集 数据交换接口 内部创作接口 电子文档处理 内容管理数据存储 结构化 数据 对象 数据 非结构化 数据 内容挖掘与知识管理服务 自动分类 自动摘要 自动聚类 查重与相似性分析 过滤与知识提取 本地内容管理 本地应用集成 本地内容采集 本地内容编辑 跨媒体发布 个性化服务 版权保护 内容评估 站点管理 电子商务 个人内容桌面 内容协作平台 内容编审 监控统计 用户管理 工作流引擎 协同工作沟通 内容管理架构 内容服务平台 内容采集创建 网络信息采集 信息采集网关 多媒体采集 数据交换接口 内部创作接口 电子文档处理 内容管理数据存储 结构化 数据 对象 数据 非结构化 数据 内容挖掘与知识管理服务 自动分类 自动摘要 自动聚类 查重与相似性分析 过滤与知识提取 本地内容管理 本地应用集成 本地内容采集 本地内容编辑 跨媒体发布 个性化服务 版权保护 内容评估 站点管理 电子商务 个人内容桌面 内容协作平台 内容编审 监控统计 用户管理 工作流引擎 协同工作沟通 内容管理架构 内容采集 Content Capture 内容存储 Content Repository 内容挖掘 Content Mining 内容加工 Content Processing 内容服务 Content Services TRS内容管理主流产品 内容服务平台 内容采集创建 网络信息采集 信息采集网关 多媒体采集 数据交换接口 内部创作接口 电子文档处理 内容管理数据存储 结构化 数据 对象 数据 非结构化 数据 内容挖掘与知识管理服务 自动分类 自动摘要 自动聚类 查重与相似性分析 过滤与知识提取 本地内容管理 本地应用集成 本地内容采集 本地内容编辑 跨媒体发布 个性化服务 版权保护 内容评估 站点管理 电子商务 个人内容桌面 内容协作平台 内容编审 监控统计 用户管理 工作流引擎 协同工作沟通 TRS INFORADAR TRS GATEWAY TRS API TRS DP TRS CKM TRS DB SERVER TRS CDS TRS WCM TRS优势特点 (1)异构资源搜索和整合 TRS能搜索各种RDBMS, 文件系统,网页等内容。其他搜索引擎不能。 (2)“安全”的搜索引擎 TRS支持内容安全性控制,特定的人只能搜索特定的内容,其他互联网搜索引擎只能进行普遍性搜索,对内容没有安全性控制。TRS是一个基于“内容安全”的搜索引擎 (3)支持数据实时更新的搜索引擎 TRS支持对数据的实时更新,其他互联网搜索引擎不支持数据的实时更新。互联网搜索引擎一般有长达数个星期的数据更新周期。在数据库内部没有动态修改数据和索引的算法。不能支持数据动态更新。 (4)更高的搜索准确性和更好的搜索体验 TRS能够对不同的内容和查询需要采用不同的索引策略,如按字,按词,混合等搜索手段,按照内容的相关性而不是PageRank 获得相关性。 互联网搜索引擎采用网页的标题和PageRank 进行相关性计算,对行业搜索引擎失去效果,查询效果和准确性差 互联网搜索引擎竞价排名等商务模式破坏了行业性用户的搜索体验 (5)智能化信息处理,提高信息使用价值 TRS具有领先的中文智能处理技术,如自动分类、自动摘要、自动聚类、信息过滤等技术,实现了高级数据挖掘应用。 互联网搜索引引擎在这方面还处于十分原始的阶段。必须基于大量的后台人工处理,这显然对企业和行业用户是不可能实现的。行业用户需要自主服务,自动服务。 (6)低成本下实现海量信息检索 TRS搜索引擎具有更低的硬件成本。在同样的硬件环境下可能支持更多的用户;其他互联网搜索引擎采用大量服务器群集实现对大规模用户的并发访问,但是对于一台机器上能够处理海量信息,能力很差。如TRS在新华社的应用采用4台服务器可以支持多达2000万文件的高效检索。 (7)多文种、多媒体、跨语言 TRS支持多文种、多媒体、跨语言查询 TRS在外交部全球网站群,新华社多媒体数据库,奥运会官方网站具有成功的应用。 (8)超越搜索,提供完整的内容管理价值链 仅有搜索是不够的,用户需要信息的整合、采集、服务、管理…等,TRS作为内容管理的领导厂商,提供全面的内容管理和内容服务;互联网

文档评论(0)

docindoc + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档