- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一站式搜索服务平台-TSearcher
柳明(洪震)@淘宝终搜
背景
诞生于淘宝-SNS,是一站式的全文搜索解决方案,起初只是支持部门内部的搜索需求。但随着产品的不断完善和发展,逐渐支持了淘宝网,天猫、B2B、一淘、聚划算等事业部的100+的应用搜索需求。
终搜产品是什么
终搜提供了用户原始数据的一个结构化副本,在副本上提供了多样的查询功能。
数据库
云梯数据
数据副本
导入
导入
业务方
终搜
查询
Select * From tab1 where col1 like ‘%xxxx%’
产品规模
终搜产品在阿里巴巴集团内部目前已经有将近300台的索引服务节点,12台全量DUMP服务节点,支撑了120亿+的文档数,和每天峰值在1亿+左右的查询请求。
背景
发展轨迹
2009-2010
2010-2011
2012-至今
第一
阶段
第二
阶段
第三
阶段
产品发展
技术关键字: Solr、Lucene,Zookeeper
业务规模:10+
数据规模:5000W+
技术关键字:Solr、Lucene、Zookeeper,Hadoop
数据规模:30+
数据规模:30亿+
技术关键字:平台化
业务规模:100+
数据规模:120亿+
成长的烦恼
业务规模的增长
终搜集群
聚划算事业部-技术部-开发一组
聚划算事业部-技术部-开发二组
应用2
应用1
(1..n)
(1..n)
….
天猫事业部-产品技术部-导购垂直线
天猫事业部-产品技术部-会员营销
应用2
应用1
(1..n)
(1..n)
….
….
成长的烦恼
数据规模的增长
成长的烦恼
其他
业务实例索引配置变化频繁,归属机器需要重启生效
业务实例依赖配置和三方jar包无版本化管理,更新轨迹无法追踪。
业务需要在线扩容怎么办
检索节点宕机,导致检索服务不稳定怎么办
寻求思路
平台化
容量扩容
业务接入
索引构建
基础服务
业务管理
中心管理
数据
检索
管理
定义和维护业务实例
状态信息收集
可视化状态信息
集群视图关系维护
全量任务分发并执行
源数据存储
索引回流
业务引擎维护
检索服务提供
状态信息汇报
平台化
协调
TSearcher
TSearcher
业务实例管理
可视化监控
DUMP中心
DUMP中心
搜索DUMP隔离
实时增量
扩容-垂直扩容
扩容-垂直扩容
扩容-水平扩容
扩容-水平扩容
容灾恢复
核心业务
Lucene版本
资源过滤
Solr版本
版本匹配过滤
业务
独占资源
正在恢复
条件过滤
优先推选
规则1
空闲资源
磁盘容量、
JVM内存
请求平均
响应时间
承载业务实
例副本
机器 Load
优先推选
规则2
优先推选
规则2
容灾恢复-机器推选
查询优化-范围查询
fn2:[10 TO 100]
0
0
0
查询优化-范围查询
热词查询优化
自定义打分公式排序
Dump导入提速
搜索大翻页查询改造
空间地理搜索
其他优化
检索层新模型
结束语
团队成员新浪微博:
@金钱松、@淘宝云就、@淘宝洪震、@李雨前、@淘宝百岁、@笨鸟能先飞吗
产品的未来
开源
QA
文档评论(0)