电商搜索跟新闻推荐用户画像近实时更新_final.pptVIP

电商搜索跟新闻推荐用户画像近实时更新_final.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
电商搜索跟新闻推荐用户画像近实时更新_final

电商搜索和新闻推荐用户画像 --近实时更新 王成光 2016-7-10 电商搜索和新闻推荐用户画像实时更新 电商搜索 基本组成 相关实现技术 新闻推荐用户画像 用户画像组成 用户画像实时更新流程 实时计算: Storm/Spark Streaming/Light_drtc 2016-7-10 电商搜索和新闻推荐 2 电商搜索 基本组成 搜索框自动补全提示 导航筛选器 关键词检索 相关实现技术 ES和Solr近年发展情况 ES vs Solr全方位比较 ES 2.X新特性 2016-7-10 电商搜索和新闻推荐 3 电商搜索组成--搜索框自动补全提示 2016-7-10 电商搜索和新闻推荐 4 亚马逊 淘宝 京东 优购 电商搜索组成--导航筛选器 2016-7-10 电商搜索和新闻推荐 5 天猫搜索筛选器 电商搜索组成--导航筛选器 2016-7-10 电商搜索和新闻推荐 6 优购搜索筛选器 电商搜索组成--关键词搜索 2016-7-10 电商搜索和新闻推荐 7 1. 同音异形搜索 2. 部分匹配搜索 3. 缺失品牌建议搜索 4. 同义词搜索 品牌别名 品类别名 电商搜索技术--当前全文检索项目 2016-7-10 电商搜索和新闻推荐 8 项目 介绍 Lucene 开发语言是Java,也是Java家族中最为出名的一个开源搜索引擎,在Java世界中已经是标准的全文检索程序,它提供了完整的查询引擎和索引引擎,无中文分词引擎,不支持实时搜索。 Solr SolrCloud Solr是一个用java开发的独立的企业级搜索应用服务器,它提供了类似于Web-service的API接口,它是基于Lucene的全文检索服务器,也算是Lucene的一个变种,很多一线互联网公司都在使用Solr,也算是一种成熟的解决方案. ES Elasticsearch是一个采用java语言开发的,基于Lucene构造的开源,分布式的搜索引擎. 设计用于云计算中,能够达到实时搜索,稳定可靠. Elasticsearch的数据模型是JSON. Sphinx Sphinx是一个用C++语言写的开源搜索引擎,也是现在比较主流的搜索引擎之一,在建立索引的事件方面比Lucene快50%,但是索引文件比Lucene要大一倍(以空间换取性能),在检索速度和精准度和中文分词方面比lucene支持差。 Mysql Mysql全文索引,自4.0开始引入,最初只支持持MyISAM引擎, 自MySQL5.6起也同时支持InnoDB引擎 。对中文支持不好,性能也相对较差。 电商搜索技术--ES集群 2016-7-10 电商搜索和新闻推荐 9 电商搜索技术--SolrCloud集群 2016-7-10 电商搜索和新闻推荐 10 电商搜索技术--ES 和 Solr综合比较 2016-7-10 电商搜索和新闻推荐 11 特性 ES Solr/SolrCloud 索引 1. 新插入10万条耗时18.8秒 2.更新2万新插入8万耗时64秒 3.索引文件相对较大(7612k) 1. 新插入10万条耗时7.2秒 2. 更新2万新插入8万耗时24秒 3.索引文件相对较小(5280K) shard中doc数 差异大 比较匀称 查询 返回10万条数据大概15毫秒 返回10万条数据大概29毫秒 健壮性 比较强 相对弱 容错性 比较强 相对弱 中文分词支持 动态添加专有词 支持度不好 无模式 实时索引 与生俱有 后期增加 电商搜索技术--ES 和 Solr近年发展 2016-7-10 电商搜索和新闻推荐 12 电商搜索技术--ES 和 Solr近年发展 2016-7-10 电商搜索和新闻推荐 13 电商搜索技术——ES2.x新特性 2016-7-10 电商搜索和新闻推荐 14 ES集群节点新增部落节点 API级显示支持文档字段级更新 ES2.X已经废弃Facet ES2.X Aggregation功能增强,支持嵌套。 ES2.X开始索引类型index_analyzer更改为analyzer ES2.2新增查询分析器: 得到查询的详细分析信息,它可以让你了解和调试查询性能。

文档评论(0)

karin + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档