- 1
- 0
- 约 26页
- 2018-03-29 发布于天津
- 举报
胡玲玲-报告
实习介绍
胡玲玲
网页搜索部
2013-09-01
目录
定位
平台组快速调研整合的流程整合部份,作为调研的统一入口,对调研的过程、工具、数据等进行有效的管理。
目标
为实现调研全过程的改善打下基础,改善大搜索,提升效率。
初识-调研流程平台
调研流程平台-整体框架
调研流程平台-整体框架
入手-LTR
用机器学习的方式做ranking
学术界一般称为Learning to rank(LTR)
也称为machine-learned ranking (MLR)
定位
机器学习在Ranking系统中应用方法的研究,产出可执行的系统方法
Ranking 问题:
简单的说:一个query下的url list,给出一个排序,使得排序和相关性高低尽可能一致。
传统上使用人工经验来确定特征的权值
得到模型易于理解
性能稳定
依赖于个人经验,难以国际化
效率较低,成本较高
采用机器学习的方法,自动从特征中构建排序模型
提高研发效率,降低国际化壁垒
参数可以自动确定
部分模型的可理解性与可解释性不佳
机器学习的发展
监督学习方法比较成熟
针对ranking的机器学习越来越多(高质量paper 百余篇以上)
为什么需要LTR?
Ranking 很难做
基础相关性
页面质量
页面权威性
……
Ranking 怎么做?
Socre(query,url)=
Function(x)=wx+b
为什么需要LT
原创力文档

文档评论(0)