- 1、本文档共48页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
TRS 企业内网门户解决方案
* 个人的信息通过KM模块提交 外部信息通过CIS等系统提交 * * 稍微展开讲企业搜索的实现过程(这个是脱开TRS产品本身而言的,体现TRS解决方案的完整性,要跳出常规的产品逻辑) 监控采集主要是针对不同数据来源,需要不同的采集工具或模块 文本过滤主要是针对网页和文档而言的,网页主要是过滤广告、导航等信息;文档主要是提取纯文本做索引(HYF的工作了);如果客户关注图片、视音频的话,可以稍提一下我们也有能力提取类似于IPTC等规范的信息即可 文本分类,不是一个必要的过程,但某些专业搜索应用中,其结果可能会按照分类架构来展现。因此可能涉及文本分类的过程。 全文索引,这个是索引库(全文检索数据库)的核心工作了,包括语言方面的处理(分词),按照字、词或混合方式进行索引。(这里主要体现语言在搜索过程中的重要性,继而引出“语言需要积累”的理念,强调TRS二十多年的技术积累和语言积累。) 搜索服务轻描淡写即可,因此后续有案例展现检索服务的。 在项目实施中,更多的客户会选择如上的表现方式 输入关键词后,由系统在各应用系统索引中进行检索,然后先给出一个检索结果汇总页面。每个应用系统或者分类,分别检索到多少条记录。对检索记录条数的汇总,实现的难度较低,效率比较高。如果要查看某一系统的结果再点击进入结果列表展现页面。 这种方式可以避免异构数据展现的繁琐问题,也可以在一定程度上提高检索效率。 * 检索除了简单的找到文档外,其进一步的价值可能需要通过关联来体现,需要让知识与知识之间通过关联形成知识地图。 例如同音词检索(这个在地名检索中可能比较实用,因为很多人未必能正确书写某些生僻地名) 相关文章推荐 热点关键词提示 * 分别介绍一下几个点即可 * * 广东移动搜索平台的案例介绍,让用户更有真实感和信心 * TRS的一些测试数据佐证 * * 小结一下TRS企业搜索解决方案涉及到的几个核心产品: TRS DB SERVER作为核心的索引库存在,其全文检索的功能和性能都是首屈一指的。 TRS Gateway是数据整个的工具,实现异构数据在数据层的整合、索引、同步(不要展开讲) TRS CDS是构建检索的应用服务平台 TRS CKM主要实现上面提及的智能搜索和处理 TRS IDS主要实现企业搜索的前提SSO (个人建议不要在这里扩大来讲,小结一下,让用户建立解决方案与产品的对应即可。有关产品的细节问题,要么下次再聊,要么让他们看资料,要么有选择性地交流。) * 应用资源整合 应用集成后的内网门户 Messages Reports Imaging RM Collaboration BPM WCM DAM DM ENTERPRISE PORTAL 建立企业门户集成规范 功能特点三:统一搜索平台 internet Research Blogs News Products The Web Images Print Content Enterprise File Shares Enterprise Application Intranet Secure Content Databases Content Mgmt CRM Corporate Web Site Spreadsheets person Presentations Reports IM Chats Documents Web Pages Email 可搜索的对象与范围 实现跨系统的企业检索平台 SSO EIP CRM OA CIS KM ERP ENTERPRISE SEARCH PLATFORM Search Services SEARCH 企业搜索的实现过程 * 监控采集 网页采集 数据库采集 文件夹采集 数据交换接口采集 智能处理 信息过滤 自动分类 自动排重 信息抽取 全文索引 中文分词 字词索引 歧义查重 索引存储 检索服务 关键词检索 高级检索 结果聚类 相关词提示 安全控制 全文检索的效果展示 智能化的搜索服务 热点词 自动追踪用户搜索行为 掌握用户搜索热点 相关文章推荐 1、利用TRS CKM的关键词抽取+TRS like函数检索实现 对于所有文章抽取5个关键词,作为另一个字段存储,每次取得文章后根据关键词进行如下检索:keyword=like(‘本文关键词’,60)。 2、可以根据关键字定义相关检索结果 同音字推荐搜索 全文检索效果展示 信息来源标注,帮助用户迅速判断文档是否所要 相关短语 1、预置数十万的主题词库提供关联 2、提供用户检索关键字自动采集、关联 相关度模型 cosine向量空间模型 简单讲: 1、根据关键字在文章出现的频度自动匹配 2、关键字与主题的相关性 3、剔除贡献较小的虚词、助词等 与业务系统的权
文档评论(0)