- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
导语
淘宝以及天猫官方对外公开或讲课关于搜索的内容存在两个比较大的问题
1、讲课的小二完全照搬 PPT内容,照本宣科并没有通过实践后总结数据做数据
统筹分析,小二并没有去开店或者实际操作优化。
2、由于阿里安全部以及内部管理规定,关于搜索这块的算法、模型等都是通过
处理严格审核后对外公布的,很多东西小二知道也不敢说。
基于以上2点导致很多商家听了很多官方解析课程、官方公布的参考文档 ,实际
操作运用确不是那么回事最终导致不能落地。
这是2014年6月9 日天猫对外的课程
对于天猫官方课程中所说的 ,很多卖家都知道这些纬度 ,都知道哪些纬度很重要。
通俗的说:随便在任何一个QQ群讨论淘宝或天猫搜索,知道纬度的人一抓一
大把 ,理论一套一套的随便抓一个问都知道。为什么知道纬度、纬度权重占比后
能把搜索做好的(做好的定义:全店搜索、类目流量占比50%以上)卖家微乎
其微?为什么知道这些后还是会感叹现在淘宝不好做?为什么最终还是在揪着
刷单怎么刷、直通车好贵等这些问题?
1 10
第 页 共 页
三部分:商品新维度导航与排序、个性化推荐、天猫导航与类目
第一部分:商品新维度导航与排序
1)、淘宝搜索排序算法与技术解析
怎么样把用户想要的、好的商品排到前面?怎样调节不同卖家的流量?给质量
好、但价格不便宜的商品更多的流量来引导市场更加规范。需要解决的问题很复
杂,但是排序结果好坏难以评判。
互联网上(各类搜索引擎、社区论坛)对搜索结果可分为以下五类
bad(差)fair (一般)good (好)excellent (非常好)perfect(完美)
通过对搜索的结果进行人工评价 ,并且对这5类计算ndcg,来判断排序结果的
好坏,通过这样的方式从而实现最终搜索的结果展现。
作为卖家而言这样排序的弊端很明显,人工干预搜索结果的偏向性和不公平性 ,
这也就是为什么在前几年存在小二可以直接操纵豆腐块位置给谁。从技术角度解
析这是非常粗放的一个评判标准,并且需要大量的人工对排序结果进行标注 ,这
2 10
第 页 共 页
种方法费时费力并且人对搜索结果的评价很难标准化。
问题的本质也是需要解决的核心点 :绕开对搜索结果的直接判断 ,间接的通过用
户反馈来评价新排序的好坏。
从卖家角度而言来说都觉得自己的产品是最好的,别人的产品都是垃圾次品 ,需
要知道排序结果的好坏、整体的好坏是很难得到的。通过对比即一个宝贝是否比
另外一个宝贝好比较容易判断的。
淘宝是如何解决这个问题的?使用 learningto rank技术来实现了对商品对
(pairwise)优化来优化排序。也就是算法通过学习收集用户的反馈进行排序,
这就是为什么可以通过刷收藏提升搜索排名(现在不行了),为什么成交单品中
黄钻买家多排名靠前,为什么单品的展现与点击占比越多排名越靠前。
简单介绍一下淘宝搜索的的发展历史 ,从数据库到搜索引擎 ,解决了商品量较大
的问题 ;那时商品排序完全依靠下降时间来排序 ,随着商品量的不断增加 ,排序
后的效果越来越差 ,就先后加入了类目相关性与文本相关性 ,商品人气分 ;再后
来为了平衡卖家流量 ,加入了卖家分 ;再后来为了更好的用户体验 ,加入了个性
化,图像质量等因素。
现在淘宝搜索的排序模型有他一定的必然性。但是每次模型的修改权重参数都需
要进行较长时间的调整 ,需要结合人工的经验预估出一些比较合理的参数 ,再不
断的通过用户反馈进行测试,找到较优的一组参数。这样做有以下缺点:
1.测试时间较长。
2.测试有效,一般可能不能达到一个最优化的效果。
3.在不断的优化过程中,对已有特征参数的调整常常被遗漏。
通过learningtorank的方法 ,通过机器学习模型来自动调整这些参数。项目命
3 10
第 页 共 页
名为Jazz ,定位是自动调整特征权重参数,但不产生新特征。之后新加入的特
征,都通过这个模型来确定它最优的参数。
原有的商品排序系统参数产生流程如下图中绿色箭头所示,新的流程如红色所
示。减少人为的因素,并且可以在线下评估效果,节省了线上ABtest的反复测
试的时
您可能关注的文档
- 第08章 传出--抗胆碱药---jw.pdf
- 专题2 研究问题确定.ppt
- 中国对外直接投资的实践及理论_杨德新.pdf
- 厦门北讯软件-售后服务管理系统讲述.pdf
- 美国工业设计专业介绍概论.pdf
- 第05课:医院精细化管理解决方案.pdf
- 部分车载电子设备介绍.pdf
- 新技能培训教案指南.doc
- KA卖场管理与合同谈判技巧( 62).ppt
- 六节--系统危险控制技术.ppt
- 2024-2025学年高中地理选择性必修2 区域发展鲁教版(2019)教学设计合集.docx
- 2024-2025学年高中地理选修五自然灾害与防治鲁教版教学设计合集.docx
- 2024-2025学年高中地理选择性必修1 自然地理基础鲁教版(2019)教学设计合集.docx
- 电讯公司合伙协议书.docx
- 2024-2025学年高中化学必修1人教版教学设计合集.docx
- 2024-2025学年高中化学必修第二册沪科版(2020)教学设计合集.docx
- 2024-2025学年高中化学必修 第二册苏教版(2019)教学设计合集.docx
- 2024-2025学年高中化学高二上学期沪科版教学设计合集.docx
- 2024-2025学年初中英语六年级上册鲁教版(五四制)(2024)教学设计合集.docx
- 2024-2025学年初中英语六年级上册上海新世纪版教学设计合集.docx
最近下载
- 烽火网管ANM2000地操作和5516下GPON型ONU业务开通介绍.docx VIP
- PON组网及原理06-AN5516-01 GPON开通配置方法.ppt VIP
- AN5516-01-GPON开通配置方法.ppt VIP
- 烽火AN5516-01 GPON开通流程.ppt VIP
- 高中数学竞赛(强基计划)历年真题练习 9 排列组合二项式定理与概率统计综合 (学生版+解析版).pdf VIP
- 中兴OLT链路聚合配置.ppt VIP
- 2023核电厂核安全文化同行评估导则.doc
- OLT设备测试1.doc VIP
- 高中数学竞赛(强基计划)历年真题练习 4 向量 (学生版+解析版).pdf VIP
- 【高中数学竞赛真题•强基计划真题考前适应性训练】 专题06 不等式 真题专项训练(全国竞赛+强基计划专用)解析版.docx VIP
文档评论(0)