- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
因果推断学习笔记三—— Uplift模型
⼀、Uplift模型
因果推断在互联⽹界应⽤主要是基于Uplift model来预测额外收益提升ROI。Uplift模型帮助商家计算⼈群营销敏感度,驱动收益模拟预算
和投放策略制定,促成营销推⼴效率的最⼤化。同时如何衡量和预测营销⼲预带来的 “增量提升”,⽽不是把营销预算浪费在 “本来就会转
化”的那部分⼈⾝上,成为智能营销算法最重要的挑战。
举个例⼦ :对⽤户A和⽤户B都投放⼴告,投放⼴告后⽤户A的CVR (转化量/点击量)为5%,⽤户B的CVR为4%,那么是否就给⽤户
A投⼴告呢?仅从投放⼴告后的结果来看是这样的。但如果投放⼴告前⽤户A的CVR为4%,⽤户B的CVR为2%,那么我们就认为⼴告投放
本⾝所带来的收益B要⽐A多,所以把⼴告投给⽤户B。
Uplift模型的作⽤就是计算⼈群营销敏感度,具体就是计算每个⽤户的增益,再根据⼴告主设置的预算以及其它限制看是否对该⽤户投放⼴
告。
persuadables: 不发券就不购买、发券才会购买的⼈群,即优惠券敏感⼈群
sure thing:⽆论是否发券,都会购买,⾃然转化
lost causes :⽆论是否发券都不会购买,这类⽤户实在难以触达到,直接放弃
sleeping dogs :与persuadables相反,对营销活动⽐较反感,不发券的时候会有购买⾏为,但发券后不会再购买。
建模时主要针对persuadables⼈群,并且要避免sleeping dogs⼈群。如果使⽤reponse model,则难以区分这⼏类⼈群,因为模型只预
测是否购买,可能转化的⽤户中persuadable的⽐例相当少,并不是营销中的target。
Uplift模型⽤于预测/估计某种⼲预对个体状态/⾏为的因果效应。可以形式化为以下等式:
τ = p (Y ∣X , T = 1) − p (Y ∣X , T = 0) (1)
i i i i i i i
其中,Y 表⽰潜在结果 (⽐如转化率,点击率等),X 表⽰⽤户的特征,T = 1表⽰进⾏⼲预,T = 0表⽰不进⾏⼲预,应⽤在⼴告营销
i i i i
中就可以形象的表⽰为某⽤户在经过⼴告投放⾏为之后,⽤户发⽣某种⾏为 (点击或购买)增加的概率。
注意到,对于⼀个⽤户,我们只能对他进⾏⼲预或者不⼲预,即只能观测到T = 1或T = 0 ,所以对于⼀个个体的增益τ 是观测不到的。
1 1 i
所以我们可以考虑总体的 (⼈群的⼦⼈群,即⽤⼀个⼈群的因果效果来表⽰⼀个单个⼈的因果效果),即平均因果效应(Average
treatment effect,简记为ATE) :
AT E = E (Y (1) − Y (0)) = E (Y (1)) − E (Y (0)) (2)
i i i i
Ti ∈ {0, 1}表⽰是否进⾏⼲预,那么可有
Y obs = T Y (1) + (1 − T )Y (0)
文档评论(0)