基于企业搜索的数据整合技术初探.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
用户真正感兴趣的,但是搜索结果只返回了20条, 表2互联网搜索与企业搜索的比较 那么召回率就是20%。一般来说,召回率越高,搜 类别 互联网搜索 企业搜索 索引擎的效率就越高。 异构资源 互联网通信协议 企业环境下各种信息采集接口 但是在很多情况下,精准率与召回率是此消彼 搜索和 以H717rP传输协网页HTML/XML(HrnlP); 整合 议为主的HTML 长的关系,大部分的搜索技术对于这2项指标都是 关系数据库(API/SQL) 和格式文档 文件系统(NFS、I,’Fp) 呈现互补的关系。在搜索时,可以通过设置一些更 (DOC、P门、PDF、 办公系统Office/Lotus/OA/ 严格的搜索参数可以过滤掉大部分的不相关结果 MP3、图片、音频、 邮件系统(Exchange/EMail) 从而提高精准率,但同时可能也会排除掉一些相关 视频) 各种应用系统(ERP/CRM/KM/ 的结果而降低召回率。搜索技术的进步就是要力 EIS…···) 争同时实现较高的精准率和召回率。 数据更新 更新周期较长, 即时反映企业信息更新;通过动态 通过静态缓存的 更新索引来保证数据一致性。 1.3选择搜索的指标 索引并周期切换 精准率和 召回率不可能很 召回率要求高;精准率方面要求能 1.3.1 灵活性 召回率 高;精准率以 精确计算,可以混合索引和复合元 搜索资料是企业搜索的一项基本而又重要的 Rank、Title、数据查询,具有数据的结构化特 Page 应用,随着企业的发展,企业需要对数据信息进一 Meta等为主,具征,结果更准确、排序更合理。 步分类、聚合,进行各种深度挖掘为企业管理者和 有商业性因素。 决策者提供数据依据。因此,企业需要的是一种灵 安全性 相对公开的信息, 数据【方问权限一般有严格的控制。 安全性要求低。 活的搜索技术,而不仅是从一个应用系统到另一个 搜索结果 搜索到信息后服 对搜索结果需要整合和管理;能智 应用系统问分散的搜索。也就是说,企业搜索技术 的应用 务完成。 能挖掘和分析数据(分类、聚类); 应当可以根据搜索要求,灵活地把共享文档、实时 有安全接口支持其他应用系统的 数据、应用系统数据库、网站等各种信息合并成统 数据}方问权限要求;面向企业需求 一的视图,并能根据企业需要解决的业务问题随时 提供个性化服务。 进行灵活调整。

文档评论(0)

hnlhfdc + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档