阿里云-开放搜索服务产品简介-D.docx

  1. 1、本文档共30页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
开放搜索 产品简介 开放搜索/产品简介 开放搜索/产品简介 PAGE 10 PAGE 10 产品简介 OpenSearch产品概述 简要介绍 开放搜索(OpenSearch)是一款结构化数据搜索托管服务,为移动应用开发者和网站站长提供简单、高效、 稳定、低成本和可扩展的搜索解决方案。 OpenSearch基于阿里巴巴自主研发的大规模分布式搜索引擎平台,该平台承载了阿里巴巴全部主要搜索业务 ,包括淘宝、天猫、一淘、1688、ICBU、神马搜索等业务。OpenSearch以平台服务化的形式,将专业搜索技 术简单化、低门槛化和低成本化,让搜索引擎技术不再成为客户的业务瓶颈,以低成本实现产品搜索功能并快 速迭代。 使用OpenSearch搭建搜索服务,您只需: 创建搜索应用 编辑您的应用结构 上传数据 从您的网站或应用程序提交搜索请求 开放存储服务OSS、ODPS、RDS用户还可以在OpenSearch控制台直接配置使用相应的数据源,数据将自动同 步进入OpenSearch,简单、方便、可靠。OpenSearch后续将支持更多的数据源自动同步,例如OTS、ECS等 ;提供更丰富的搜索外围功能,例如相关搜索、搜索热词、下拉提示等。敬请期待! 功能特点 OpenSearch有以下一些主要功能。 1.支持文档索引结构定制,以及自由修改。OpenSearch将搜索引擎复杂的索引结构概念简单化、可视化和自助 定制化。开发者可以通过控制台创建搜索应用,定制文档字段的结构和属性,包括字段名称、类型、分词方式 、搜索属性等。搜索应用在运行过程中可以自由修改,满足了产品快速变化的需求,极大缩短了需求变更到上 线的过程。 2.支持主流阿里云存储产品的自动对接,数据自动同步更新。开发者的数据如果在阿里云OSS、ODPS、RDS等 服务上,开发者只需要在OpenSearch控制台中授权,数据就可以自动同步至OpenSearch中,后续数据的更新 也可以自动实时同步(ODPS除外)。而且在同一区域中,从云存储同步数据至OpenSearch免收流量费用。数 据不在阿里云上的开发者,可以通过RESTful API或者SDK上传数据,小数据量也可以直接在控制台上传。 3.支持多表数据推送,及字段文本处理和转换。类似于数据库,每个搜索应用可以创建一张或者多张表,每张 表的字段上可以内置数据处理插件,对字段内容做文本处理和转换,例如拼音转换、HTML标签剔除、JSON数 据解析等,多个表会Join在一起实现联合查询。数据存放在RDS数据库里的开发者,可以用此功能替代数据库 全文检索,实现更高的性能和搜索体验。 4.支持两轮相关性排序定制,简单灵活加速产品效果优化迭代。搜索结果相关性排序是影响用户体验最关键的 一环,OpenSearch支持开发者定制两轮相关性排序规则来准确控制搜索结果的排序。第一轮为粗排,从命中 的文档集合里海选出相关文档。第二轮为精排,对粗排的结果做更精细筛选,支持任意复杂的表达式和语法。 方便开发者能更准确控制排序效果,优化系统性能,提高搜索响应速度。 为什么选择OpenSearch? 支持用户上传数据或同步云数据,实时性有保障。 应用结构、排序相关性自由定制,搜索服务更个性化。 基于阿里巴巴在搜索领域的积累,提供查询分析功能,对用户查询词进行纠错、词权重分析、停用词 过滤,让搜索服务更智能。 可视化的界面、丰富的模板,不用精通代码也能快速创建自己的搜索应用。 选择OpenSearch,就选择了简单、高效、低成本和可扩展的搜索解决方案!!! 相关概念 应用管理 名称 说明 应用 应用是用户的一套数据配置,包括应用的数据源结构,索引结构及其它一些数据属性配置。一个应用即一个搜索服务。 文档 文档是可搜索的结构化数据单元。文档包含一个或多个字段,但必须有主键字段,OpenSearch通过主键值来确定唯一的文档。 主键重复则文档会被覆盖。 字段 字段是文档的组成单元,包含字段名称和字段内容 。 插件 为了方便用户在导入过程中进行一些数据处理,系统内置了若干通用数据处理插件,可以在定义应用结构或者配置数据源的时候通过内容转换进行选择。 源数据 用户的原始数据,包含一个或多个源字段 源字段 组成源数据的最小单元,包含字段名称和字段值 ,分为文本类型、整型、浮点型三个类型 索引字段 索引是一种用于加速文档检索速度的数据结构,一个用户可以创建多个索引。 组合索引 允许用户将多个TEXT、SWS_TEXT等文本类型的源字段索引到同一个字段,用来做组合索引。如一个论坛搜索,需要提供基于标题(title)的搜索及基 于标题(title)和内容(body)的综合搜索,那么可以 将title建立title_search、default的索引,将

文档评论(0)

智慧IT + 关注
实名认证
内容提供者

微软售前技术专家持证人

生命在于奋斗,技术在于分享!

领域认证该用户于2023年09月10日上传了微软售前技术专家

1亿VIP精品文档

相关文档