阿里云-开放搜索服务产品使用手册-D.docx

  1. 1、本文档共55页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
开放搜索 产品使用手册 开放搜索/产品使用手册 开放搜索/产品使用手册 PAGE 10 PAGE 10 产品使用手册 应用类型说明 目前系统支持两种应用类型:标准版与高级版。后续仍会有更多类型推出,请各位关注。 标准版 主要应用在较简单业务场景下,尤其是对数据更新时效性要求高的场景,比如日志、物流、订单、crm等。 主要特征:更新速度快且稳定、仅支持单表。 高级版 主要应用在业务逻辑复杂,或者对搜索效果要求高的场景,,比如电商、网页检索、小说、资讯、O2O等。 主要特征:支持简单多表join逻辑、下拉提示、智能分析(同义词、纠错等)。 二者功能区别 费用说明详见购买指导部分。 功能列表 标准版 高级版 多表left join 单表 多表 数据更新命令 支持ADD/DELETE 支持ADD/UPDATE/DELETE 数据处理插件 简单 丰富 RDS自动同步 暂不支持 支持 OSS自动同步 暂不支持 支持 ODPS自动同步 支持 支持 数据更新时效性 实时 准实时 全量索引多版本 2个 1个 全量版本切换 支持 不支持 复杂分词支持 丰富 丰富 复杂查询语法 丰富 丰富 统计功能 支持 支持 排序算法 丰富 丰富 LBS服务 支持 支持 结果摘要 支持 支持 查询分析 不支持 支持 下拉提示 不支持 支持 字段类型说明 数据推送到OpenSearch后会先保存到离线数据表中,在此阶段,为了方便用户推送数据,数据表允许用户根 据实际业务场景定义多个表(需要指定关联字段),并提供了数据处理的插件。数据处理完毕后会join成一张 索引表,这种索引表主要定义搜索属性,供引擎构建索引及查询使用。 这里分别介绍下数据表与索引表的字段对应关系。 数据表字段 数据表主要为数据导入时使用,不同的数据处理插件对类型有不同的要求,这里只是初步类型选择,下一步将 有更细化的类型。具体字段取值范围,请参见系统限制-字段相关部分说明。超过取值范围将溢出或者截断,请 务必保证选择类型正确。 类型 说明 INT int64整型 INT_ARRAY int64整型数组 FLOAT 浮点型 FLOAT_ARRAY 浮点型数组 DOUBLE 浮点型 DOUBLE_ARRAY 浮点型数组 LITERAL 字符串常量,仅支持精确匹配 LITERAL_ARRAY 字符串常量数组,单个元素仅支持精确匹配 SHORT_TEXT 短文本,长度在100字节内,支持若干分词方式 TEXT 长文本,支持若干分词方式 索引表字段 对于INT及FLOAT类型介绍这里不再累赘(限制详见系统限制),重点介绍下各字段类型。 主要类型介绍 搜索效果如何跟分词有很大的关系,分词方式直接影响最终的搜索效果展示,目前系统支持若干的分词方式 ,需要根据实际业务场景的需求选择合适的字段类型。 接下来,我们详细说明下各个字段的展现效果及适用场景,供大家参考。 不分词 不分词,适合一些需要精确匹配或者只展示不搜索的场景,如标签、关键词、url等。LITERAL、INT类型可选 如文档字段内容为菊花茶,则只有搜索菊花茶的情况下可以召回。。 如文档字段内容为菊花茶,则只有搜索菊花茶的情况下可以召回。 中文基础分词 如文档字段内容为菊花茶,则搜索菊花茶、菊花、茶、花茶的情况下可以召回。按照检索单元做分词,适合有语义的中文搜索场景,如标题、文本等。TEXT及SHORT_TEXT类型可选。 如文档字段内容为菊花茶,则搜索菊花茶、菊花、茶、花茶的情况下可以召回。 中文单字分词 如文档字段内容为菊花茶,则搜索菊花茶、菊花、茶、花茶、菊、花、菊茶的情况下可以召回。按照单字/单词分词,适合非语义的中文搜索场景,如小说作者名称、店铺名等;TEXT及SHORT_TEXT类型可 选。 如文档字段内容为菊花茶,则搜索菊花茶、菊花、茶、花茶、菊、花、菊茶的情况下可以召回。 模糊分词 如文档字段内容为菊花茶,则搜索菊花茶、菊花、茶、花茶、菊、花、菊茶、ju、juhua、juhuacha、 j、jh、jhc等情况下可以召回。如文档字段内容为手机则通过^138来搜索以138开头的手机号,通过5678$搜索以5678结尾的手 机号; 如文档字段内容为菊花茶,则搜索菊花茶、菊花、茶、花茶、菊、花、菊茶、ju、juhua、juhuacha、 j、jh、jhc等情况下可以召回。 如文档字段内容为手机则通过^138来搜索以138开头的手机号,通过5678$搜索以5678结尾的手 机号; 如文档字段内容为OpenSearch,则通过单个字母或者组合都可以检索到。 英文去词根分词 如文档字段内容为英文分词器 english analyzer,则搜索英文分词器、english、

文档评论(0)

智慧IT + 关注
实名认证
内容提供者

微软售前技术专家持证人

生命在于奋斗,技术在于分享!

领域认证该用户于2023年09月10日上传了微软售前技术专家

1亿VIP精品文档

相关文档