因果推断学习笔记三——Uplift模型.pdfVIP

下载本文档

17
0
约1.88万字
约 9页
2023-07-28 发布于湖北
举报
版权申诉

因果推断学习笔记三——Uplift模型.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

因果推断学习笔记三—— Uplift模型⼀、Uplift模型因果推断在互联⽹界应⽤主要是基于Uplift model来预测额外收益提升ROI。Uplift模型帮助商家计算⼈群营销敏感度，驱动收益模拟预算和投放策略制定，促成营销推⼴效率的最⼤化。同时如何衡量和预测营销⼲预带来的 “增量提升”，⽽不是把营销预算浪费在 “本来就会转化”的那部分⼈⾝上，成为智能营销算法最重要的挑战。举个例⼦：对⽤户A和⽤户B都投放⼴告，投放⼴告后⽤户A的CVR （转化量/点击量）为5%，⽤户B的CVR为4%，那么是否就给⽤户 A投⼴告呢？仅从投放⼴告后的结果来看是这样的。但如果投放⼴告前⽤户A的CVR为4%，⽤户B的CVR为2%，那么我们就认为⼴告投放本⾝所带来的收益B要⽐A多，所以把⼴告投给⽤户B。 Uplift模型的作⽤就是计算⼈群营销敏感度，具体就是计算每个⽤户的增益，再根据⼴告主设置的预算以及其它限制看是否对该⽤户投放⼴告。 persuadables: 不发券就不购买、发券才会购买的⼈群，即优惠券敏感⼈群 sure thing：⽆论是否发券，都会购买，⾃然转化 lost causes ：⽆论是否发券都不会购买，这类⽤户实在难以触达到，直接放弃 sleeping dogs ：与persuadables相反，对营销活动⽐较反感，不发券的时候会有购买⾏为，但发券后不会再购买。建模时主要针对persuadables⼈群，并且要避免sleeping dogs⼈群。如果使⽤reponse model，则难以区分这⼏类⼈群，因为模型只预测是否购买，可能转化的⽤户中persuadable的⽐例相当少，并不是营销中的target。 Uplift模型⽤于预测/估计某种⼲预对个体状态/⾏为的因果效应。可以形式化为以下等式: τ = p (Y ∣X , T = 1) − p (Y ∣X , T = 0) (1) i i i i i i i 其中，Y 表⽰潜在结果（⽐如转化率，点击率等），X 表⽰⽤户的特征，T = 1表⽰进⾏⼲预，T = 0表⽰不进⾏⼲预，应⽤在⼴告营销 i i i i 中就可以形象的表⽰为某⽤户在经过⼴告投放⾏为之后，⽤户发⽣某种⾏为（点击或购买）增加的概率。注意到，对于⼀个⽤户，我们只能对他进⾏⼲预或者不⼲预，即只能观测到T = 1或T = 0 ，所以对于⼀个个体的增益τ 是观测不到的。 1 1 i 所以我们可以考虑总体的（⼈群的⼦⼈群，即⽤⼀个⼈群的因果效果来表⽰⼀个单个⼈的因果效果），即平均因果效应(Average treatment effect，简记为ATE) ： AT E = E (Y (1) − Y (0)) = E (Y (1)) − E (Y (0)) (2) i i i i Ti ∈ {0, 1}表⽰是否进⾏⼲预，那么可有 Y obs = T Y (1) + (1 − T )Y (0)